スマートスピーカー、視覚障害者向けにどう改良できるのか:スクリーンリーダーを統合
Webにアクセスして情報を収集し、特に知りたい詳細部分だけを聴く。視覚障害者にはこれが難しい。ウォータールー大学などの研究者は、音声アシスタントとスクリーンリーダーの機能を組み合わせた視覚障害者向けWebアクセスツール「VERSE」を開発した。
カナダのウォータールー大学とMicrosoft Research、米ワシントン大学の研究者のチームが、音声アシスタントとスクリーンリーダー(画面読み上げソフトウェア)の機能を組み合わせたツール「VERSE(Voice Exploration, Retrieval, and Search)」のプロトタイプを開発した。
視覚障害者がスマートスピーカーなどの仮想アシスタントデバイスを通じて、Webコンテンツを素早く簡単に検索、利用できる方法を研究した結果生まれたツールだ。
仮想アシスタントとスクリーンリーダーのいいとこ取り
ウォータールー大学のDavid R.Cheriton School of Computer Scienceで博士課程に在籍し、Microsoft Researchでのインターン期間中に研究に加わったAlexandra Vtyurina氏は仮想アシスタントとスクリーンリーダーの課題を次のように指摘した。
「仮想アシスタントは便利でアクセシビリティーが高い。だが、記事の冒頭以降の部分を読み上げたり、検索結果や提案を列挙したりするなど、コンテンツに深く関与する機能が欠けている」
例えばスマートスピーカーに対して「コンピュータ科学とは何か」と尋ねると、「コンピュータ科学とは××のことです」といった短文の説明が返ってくる。だが、「もっと説明が欲しい」と続けても答えは返ってこない。
「これに対し、(与えられた文章を読み上げる)スクリーンリーダーはアクセスしたいコンテンツに深く関与でき、きめ細かなナビゲーションや制御が可能だ。しかし、手軽さに欠ける」(Vtyurina氏)
VERSEはこのような2つの技術の欠点をカバーするツールだという。
VERSEの主な入力方法は音声であり、ユーザーは「next」(次)、「previous」(前)、「go back」(戻る)、「go forward」(進む)などと音声で指示できる。
先ほどの質問であれば、例えば「コンピュータ科学とは××のことです。10カ所のWebサイトと10本の動画、Wikipediaの関連記事を10本見つけました」という答えが返ってくる。
ここで「Webサイトの検索結果に進んでほしい(Go to Web results)」と発音すると、Webサイトの冒頭を読み上げる。さらに詳細を求めると「この記事は35段落、3382語の単語からなる」との返答があり、最初の段落に進む。さらにリンク先に進むことも可能だ。
コンピュータ科学について調べる際、音声だけでは操作が長くなり、多少効率が悪い。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 「スマートスピーカー」の中にある「人工知能」は何をしているのか、作り方から理解する
世界の名だたるプラットフォーマーが開発に力を入れる「スマートスピーカー」。どのような手順でどんな処理が行われているのかは完全にブラックボックスだ。「スマートスピーカーを理解するには、自作するのが早道」と提唱する開発者に話を聞いた。 - 教えて! キラキラお兄さん「プログラミングは視覚障害者にオススメの職業って本当ですか?」
視覚障害者こそ、PCを使いこなしていろいろな仕事についてもらいたい――全盲のセキュリティエンジニアは、画面読み上げソフト(スクリーンリーダー)を駆使して、人の役にたつモノ作りを続けている。 - 「音」と「振動」で分かるモノやヒトの状態、安価に実現する2つの手法
カーネギーメロン大学の研究チームは、周囲で何が起こっているかを音や振動状態から認識できる安価な2つの手法を開発した。これらの手法を用いると、モノやヒトの状態が分かるだけでなく、モノを入力デバイスとして利用できるという。