1.5秒の音声で何語なのかをリアルタイムに識別――NICT、8カ国語を聞き分ける言語識別技術を開発
情報通信研究機構(NICT)は、短い発話音声から何語なのかを識別する言語識別技術を開発。1.5秒程度の音声を識別時間0.15秒以内のリアルタイムで識別する。8言語(日、英、中、韓、タイ、ミャンマー、ベトナム、インドネシア)に対応し、何語を話しているか分からない相手の言葉も即座に識別する。
情報通信研究機構(NICT)は2018年10月18日、人の発話が何語であるのかを1.5秒程度の短い音声を基に識別できる言語識別技術を開発したと発表した。日、英、中、韓、タイ、ミャンマー、ベトナム、インドネシアの8言語に対応する。
同技術は、言語識別に必要な発話の特徴を精度よく抽出し、高速演算できるニューラルネットワークを活用して、1.5秒程度の短い発話でも0.15秒以内というほぼリアルタイムに識別できるようにした。
この技術を音声認識や自動翻訳に使えば、何語を話しているか分からない外国人の言葉を即座に識別できる。
多くの音声認識アプリケーションでは、あらかじめ聞き取る言語を設定する必要があり、相手が話している言語が分からない場合には、言語の指定自体が困難だった。
これを解決する方法として、入力された発話音声が何語なのかを識別する言語識別技術が利用されるが、従来の一般的な方式では、10秒程度の長い発話でないと識別が困難なため、音声認識アプリにはあまり実装されていなかった。
今回、NICTでは「知識蒸留(Knowledge Distillation)」という手法を用いて、言語識別に必要な発話の特徴を精度よく抽出する長い発話用のニューラルネットワークを変換し、短い発話でも高精度かつリアルタイムに識別できる小規模ニューラルネットを構築する方式を活用した。

言語識別技術に取り入れた知識蒸留による学習のイメージ。高度で複雑な大規模ネットワーク(Teacher)が学習した知識を、軽量でシンプルな小規模ネットワーク(Student)の学習に利用する。Teacherは言語識別に必要な計算に時間がかかるが、Studentは高速演算が可能
この方式により、1.5秒程度の短い発話でも即座(0.15秒)に識別する言語識別技術を開発し、8言語を90%以上で識別可能とした。
米Googleがスマートスピーカー用APIとして公開している音声翻訳アプリでは、一度に言語識別できるのは4言語で、NICTでは、今回開発した方式ではこれを上回ると説明。
今後、識別言語数の拡張や識別精度の向上を図るとともに、NICTが実証実験用に無料公開しているスマートフォン用音声翻訳アプリ「VoiceTra」にも実装する方針。また、音声翻訳アプリ向け技術として、民間企業へのライセンス提供も予定している。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
復号せずに複数の暗号化データの関連性を解析、NICTらが医療データ解析で実証
NICTと筑波大学は、医療データを暗号化されたまま解析する技術「まぜるな危険準同型暗号」を利用して、医療データを復号せずに、解析対象のデータかどうかを判別できることを実証した。個人の遺伝情報と病気の罹患情報との統計的な関連性を、各個人の病気の有無や遺伝情報を知ることなく安全に解析できるため、医療ビッグデータを安全に活用しやすくなる。KDDI総合研究所や横浜国立大学ら、Web媒介型サイバー攻撃対策の実証実験として「タチコマSA」を無償配布
KDDI総合研究所などは、一般ユーザーを対象にWeb媒介型攻撃対策ソフト「タチコマSA」を無償配布して、ユーザー参加型の実証実験を始める。機械学習を駆使して、攻撃を検知する手法も検討する。AIによる災害情報のSNS分析、確実な運用に備え、防災訓練にも――慶大、NICT、NIEDが訓練ガイドライン策定
慶応義塾大学の山口真吾研究室、情報通信研究機構(NICT)、防災科学技術研究所(NIED)は、災害時に発信されるSNS情報をAIで分析し、応急対策に活用する仕組みを防災訓練に取り入れ、確実な運用体制を築くためのガイドラインを策定した。NICT、「SecHack365」の2018年度受講生を募集開始 ハッカソンで高度なセキュリティ技術者を育成
情報通信研究機構(NICT)ナショナルサイバートレーニングセンターが、25歳以下を対象にした、「SecHack365」の2018年度受講生の募集を開始。開発、研究、実験、発表をハッカソン形式で繰り返す実践的な学習で、高度な技術力を持つセキュリティイノベーターを育成する。NICT、演習自動構築システム導入で、受講者のスキルや業務に合ったサイバー演習を提供へ
情報通信研究機構(NICT)は、受講者のスキルや業務に合わせた効果的なサイバー演習を自動的に構築するシステム「CYDERANGE」を開発。NICTが政府機関や企業向けに提供するサイバー防御演習「CYDER」に導入し、業種や分野ごとに最適化した演習を提供するという。