もう親指は要らない? au、新しい音声入力機能搭載

2006/1/13

 KDDIは1月12日、auの携帯電話に分散型音声認識機能「声de入力」を搭載すると発表。2月上旬より、歩行者向けナビゲーションサービスであるEZナビウォークの「声で乗換検索」「声で目的地検索」にて提供する。

KDDI au商品企画本部 モバイルサービス部 サービスグループ 課長 幡容子氏
 声de入力は分散型音声認識機能(DSR:Distributed Speech Recognition)を提供するサービスで、2月上旬にリリースされる第3世代端末「A5518SA」「Sweets pure」「A5520SA」の3機種から対応する。DSRを搭載するのは、SymbianOSやWindows Mobileなどの汎用OSを搭載した端末以外では世界で初めてだという。

 DSRは、音声認識機能を携帯電話側とサーバ側で分散処理する技術。実際の処理は、ユーザーが発声した音声の特徴を端末がパラメータとして抽出し、この音声パラメータをデータ網を利用してセンター側のサーバに送信。サーバ側の辞書と照合して最も確からしい言葉を認識結果として選択し、認識結果を端末に戻すという流れだ。

 このように、音声認識エンジンや辞書といった高いハードウェアスペックが要求される部分をサーバ側に置いたことによって、携帯電話のスペックでは搭載が難しかった高い精度の音声認識機能を携帯電話に搭載することが可能になったという。声de入力を搭載したことによる最大のメリットを、KDDI au商品企画本部 モバイルサービス部 サービスグループ 課長 幡容子氏は、「利便性が向上したことだ。乗換検索や目的地検索ではキー操作による入力がとても大変だった。これを音声で一発入力できれば、かなり省力できるだろう」と説明した。

 実際のEZナビウォーク「声で乗換検索」では、「どこから」「どこまで」「いつ」を発声するだけで結果がでる。この際のキー操作は1回だ。一方、通常の乗換検索の場合、6回のキー操作が必要だという。キー操作ごとにサーバの反応を待つ時間などがかかるため、時間も短縮できるとした。音声入力の方法も、「表参道のレストラン」や「西武新宿駅」「東京都千代田区飯田橋3-10-10」といったさまざまないい方に対応する。

EZナビウォークのトップページ。「声で目的地検索」が新しく加わっている
音声をサーバで分析しているところ。平均1秒程度だという。レスポンスは想像以上に速かった
音声入力が失敗したところ。「声が大きかったため」と原因を指摘してくれるので、次回以降気をつけることができる

 対応端末は、A5518SAなど3端末以降に発売されるEZナビウォーク対応端末。声で目的地検索はパケット代だけで利用できるが、声で乗換検索はパケット代および会員料金が必要となる。1回の検索に必要な料金は、住所や駅名などの長さに比例するものの、「パケ割が適用されている場合で、1回の検索におおよそ3〜4円程度」(幡氏)という。

 店名や施設名などのデータは、ナビタイムの上位1万件が登録されているが、今後の利用状況次第で増加も検討するという。また、BREWアプリ上での動作も可能となっており、APIの公開なども検討しているとした。

(@IT 大津心)

[関連リンク]
KDDIの発表資料

[関連記事]
キャラクターが大集合、KDDIが携帯向けゲームポータル開設 (@ITNews)
どこまで安い? NTTドコモが普及版FOMAを発表 (@ITNews)
携帯電話に「電子三半規管」、ボーダフォン (@ITNews)
DDIポケットが256Kbps通信開始へ、定額音声通話も検討 (@ITNews)
ハセキョーも応援、ドコモがFOMA新シリーズ発表 (@ITNews)

情報をお寄せください:



@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)