ヒトの聴覚を模倣、米ベンチャーがノイズ処理チップを国内販売シャープ製のケータイ「SH705iII」で初採用

» 2008年06月12日 00時00分 公開
[西村賢,@IT]

 米オーディエンスは6月12日、異なる音源を区別してノイズ処理ができる携帯端末や家電製品向けの音声プロセッサ「A1010」の販売を日本市場で本格的に開始したと発表した。雑踏や、マイクを通したアナウンスの声、電車の音など雑音が激しい環境でも、クリアな音声コミュニケーションが可能になる(オーディエンスによる音声デモンストレーションページ)。米オーディエンスでは、こうした処理を行う音声プロセッサの商用製品は業界初としている。

 ヒトの聴覚で“カクテルパーティー効果”として知られる高度な処理に似たデジタル処理を専用チップで行う。人間は雑多な音源や、複数の人の話し声が入り混じった環境でも、対話中の相手の声だけを聞くことができる。これは音程や音量の変化、音の方向、タイミング、視覚情報などを統合的に脳で処理し、学習に基づいて音の種類を判別、不要な音源の音を無視する処理をしているからだ。

 オーディエンスが開発した「ASA(Auditory Scene Analysis:聴覚の情景分析)」では、周波数、時間、音圧の3軸で環境音を分析。単純な周波数による切り分けでは区別できない音源をグループ化することができるという。グループ化に有効な要素の1つは音程パターンで、ASAでは男女の声を容易に区別できるという。また、2つのマイクが使える場合には音源の方向と距離からも、ノイズを判別できる(米オーディエンスの技術説明資料)。

ASAの動作原理(オーディエンスの説明資料より)。音程パターン、タイミング、方向、音圧などをヒントに2つのマイクで各音源をグループ化する

 A1010は定常、非定常のノイズを500ミリ秒以内に最大25デシベルまで抑圧できる。雑音下における主観的な音声品質テスト(MOS:Mean Opinion Score。最低から最良まで1〜5点の評価を行う)で、A1010を使った場合には0.5ポイント改善したという。

 2.7×3.5ミリと小型で、すでに中、高級端末向けとしてサンプル出荷を開始している。サンプル価格は1個500円。端末メーカー、OEM、ODM、周辺機器ベンダ向けにハードウェアとソフトウェアを提供していく。日本における販売は緑屋電気を通して行う。なお、A1010の世界初の採用例として、NTTドコモ向けにシャープが開発した「SH705iII」が2008年4月から販売されている。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。