Webにアクセスして情報を収集し、特に知りたい詳細部分だけを聴く。視覚障害者にはこれが難しい。ウォータールー大学などの研究者は、音声アシスタントとスクリーンリーダーの機能を組み合わせた視覚障害者向けWebアクセスツール「VERSE」を開発した。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
カナダのウォータールー大学とMicrosoft Research、米ワシントン大学の研究者のチームが、音声アシスタントとスクリーンリーダー(画面読み上げソフトウェア)の機能を組み合わせたツール「VERSE(Voice Exploration, Retrieval, and Search)」のプロトタイプを開発した。
視覚障害者がスマートスピーカーなどの仮想アシスタントデバイスを通じて、Webコンテンツを素早く簡単に検索、利用できる方法を研究した結果生まれたツールだ。
ウォータールー大学のDavid R.Cheriton School of Computer Scienceで博士課程に在籍し、Microsoft Researchでのインターン期間中に研究に加わったAlexandra Vtyurina氏は仮想アシスタントとスクリーンリーダーの課題を次のように指摘した。
「仮想アシスタントは便利でアクセシビリティーが高い。だが、記事の冒頭以降の部分を読み上げたり、検索結果や提案を列挙したりするなど、コンテンツに深く関与する機能が欠けている」
例えばスマートスピーカーに対して「コンピュータ科学とは何か」と尋ねると、「コンピュータ科学とは××のことです」といった短文の説明が返ってくる。だが、「もっと説明が欲しい」と続けても答えは返ってこない。
「これに対し、(与えられた文章を読み上げる)スクリーンリーダーはアクセスしたいコンテンツに深く関与でき、きめ細かなナビゲーションや制御が可能だ。しかし、手軽さに欠ける」(Vtyurina氏)
VERSEはこのような2つの技術の欠点をカバーするツールだという。
VERSEの主な入力方法は音声であり、ユーザーは「next」(次)、「previous」(前)、「go back」(戻る)、「go forward」(進む)などと音声で指示できる。
先ほどの質問であれば、例えば「コンピュータ科学とは××のことです。10カ所のWebサイトと10本の動画、Wikipediaの関連記事を10本見つけました」という答えが返ってくる。
ここで「Webサイトの検索結果に進んでほしい(Go to Web results)」と発音すると、Webサイトの冒頭を読み上げる。さらに詳細を求めると「この記事は35段落、3382語の単語からなる」との返答があり、最初の段落に進む。さらにリンク先に進むことも可能だ。
コンピュータ科学について調べる際、音声だけでは操作が長くなり、多少効率が悪い。
そこでVERSEをスマートフォンやスマートウォッチで動作するアプリと組み合わせるようにした。この場合、これらのデバイスは、キーボードショートカットに似た入力アクセラレーターとして機能する。例えば、スマートウォッチの竜頭を回転させると、ナビゲーションモードに応じて、VERSEは次の検索結果やセクション、段落に進む。スマートフォンであれば画面のシングルタップやダブルタップ、スワイプなどで操作できる。
VERSEの開発に至る研究では、視覚障害のあるWebユーザー53人の協力を得て調査した。回答者の過半数は、1日に何度も仮想アシスタントを使うと答えた。スマートスピーカーやスマートフォン、スマートTVなど、幅広いデバイスを使っているという。
この調査で収集したデータを、VERSEのプロトタイプ開発に利用した。
「VERSEは、一見すると他の仮想アシスタントに似ている。質問すると、単語やフレーズ、句などを答えとして読み上げるからだ。だが、そこから先がユニークだ。もっと情報が必要なら、ユーザーはVERSEを使って他のタイプを検索(ニュース、事実、関連する検索結果などの検索)することができ、検索結果として返された任意の記事にアクセスできる。スクリーンリーダー機能のおかげで、記事の単語や文、段落、セクションごとにナビゲートできる」(Vtyurina氏)
VERSEを発展させることで、将来は視覚障害者だけではなく、視覚に問題がないユーザーに対しても、Webアクセシビリティーを改善できるという。これは第二世代のスマートスピーカーへとつながっていく動きだ。
研究チームは、2019年10月に米ペンシルベニア州ピッツバーグで開催される「21st International ACM SIGACCESS Conference on Computers and Accessibility」で、研究論文「VERSE: Bridging Screen Readers and Voice Assistants for Enhanced Eyes-Free Web Search」のプレゼンテーションを行う。
Copyright © ITmedia, Inc. All Rights Reserved.