日立製作所は、雑音に左右されずに音を基に状況を認識するAI技術を開発。ディープニューラルネットワーク(DNN)で音を分解することで、高精度な状況判断を実現。設備の稼働状況診断や人の活動状態の見守りなどに応用できるという。
日立製作所は2018年11月5日、周囲の雑音に影響されずに音に基づいて状況を認識できるAI技術を開発したと発表した。音で工場設備の稼働状態を認識する自動診断するサービスなどに活用を見込む。
同技術は、さまざまな環境音や反響音など、雑音が含まれる音を音源の方向や音色の違いなど、複数の観点に基づいて分解し、分解した音を基に高精度に状況を認識するもの。
具体的には、複数のマイクロフォンで録音した雑音が混ざったさまざまな音を、マイクロフォン間に音が到達する時間差から推定される音源の方向や、音色の違いから推測される直接音か反響音かの違いなど、複数の観点に基づいてディープニューラルネットワーク(DNN)モデルとして分解。次に、各DNNモデルとして分解した音に対応する状況を確率計算し、最後にそれらの計算結果の多数決によって、総合的な状況認識結果を出力する。
それぞれのDNNが受け持っている1つの観点だけに頼ると雑音に影響されやすいが、複数のDNNの多数決による結果を確認することで、雑音に影響されにくくなるという。これにより、多様な種類の雑音が存在する環境でも、高精度な状況認識が可能になるとしている。
今後は、さらなる機能向上を図り、音による状況診断技術として実用化を目指す。将来的には、音に基づいて設備の状態を自動診断するサービスの他、人の活動状態を自動認識する見守りサービスなどへの応用が期待されるとしている。
なお、同技術は、IEEE AASP TC(IEEE Audio and Acoustic Signal Processing Technical Committee)が公認する、音響認識分野で最大の国際コンペティション「DCASE 2018 Challenge」の「Task 5」(音響識別性能テスト)で第1位のスコアを獲得し、効果を確認したという。2018年11月6日〜8日には、東京電機大学で開催される「電子情報通信学会 第33回 信号処理シンポジウム」で同技術の成果発表を予定している。
Copyright © ITmedia, Inc. All Rights Reserved.