Webにアクセスして情報を収集し、特に知りたい詳細部分だけを聴く。視覚障害者にはこれが難しい。ウォータールー大学などの研究者は、音声アシスタントとスクリーンリーダーの機能を組み合わせた視覚障害者向けWebアクセスツール「VERSE」を開発した。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
カナダのウォータールー大学とMicrosoft Research、米ワシントン大学の研究者のチームが、音声アシスタントとスクリーンリーダー(画面読み上げソフトウェア)の機能を組み合わせたツール「VERSE(Voice Exploration, Retrieval, and Search)」のプロトタイプを開発した。
視覚障害者がスマートスピーカーなどの仮想アシスタントデバイスを通じて、Webコンテンツを素早く簡単に検索、利用できる方法を研究した結果生まれたツールだ。
ウォータールー大学のDavid R.Cheriton School of Computer Scienceで博士課程に在籍し、Microsoft Researchでのインターン期間中に研究に加わったAlexandra Vtyurina氏は仮想アシスタントとスクリーンリーダーの課題を次のように指摘した。
「仮想アシスタントは便利でアクセシビリティーが高い。だが、記事の冒頭以降の部分を読み上げたり、検索結果や提案を列挙したりするなど、コンテンツに深く関与する機能が欠けている」
例えばスマートスピーカーに対して「コンピュータ科学とは何か」と尋ねると、「コンピュータ科学とは××のことです」といった短文の説明が返ってくる。だが、「もっと説明が欲しい」と続けても答えは返ってこない。
「これに対し、(与えられた文章を読み上げる)スクリーンリーダーはアクセスしたいコンテンツに深く関与でき、きめ細かなナビゲーションや制御が可能だ。しかし、手軽さに欠ける」(Vtyurina氏)
VERSEはこのような2つの技術の欠点をカバーするツールだという。
VERSEの主な入力方法は音声であり、ユーザーは「next」(次)、「previous」(前)、「go back」(戻る)、「go forward」(進む)などと音声で指示できる。
先ほどの質問であれば、例えば「コンピュータ科学とは××のことです。10カ所のWebサイトと10本の動画、Wikipediaの関連記事を10本見つけました」という答えが返ってくる。
ここで「Webサイトの検索結果に進んでほしい(Go to Web results)」と発音すると、Webサイトの冒頭を読み上げる。さらに詳細を求めると「この記事は35段落、3382語の単語からなる」との返答があり、最初の段落に進む。さらにリンク先に進むことも可能だ。
コンピュータ科学について調べる際、音声だけでは操作が長くなり、多少効率が悪い。
Copyright © ITmedia, Inc. All Rights Reserved.