Meta、1000以上の言語に対応する音声認識モデルなどを構築、オープンソースで公開対応言語をタスクに応じて従来の10〜40倍に

Metaは、音声技術の対応言語を拡大することを目指す「Massively Multilingual Speech」(MMS)プロジェクトの成果として、音声認識モデル、音声合成モデル、言語識別モデルとコードをGitHubで公開した。

» 2023年05月25日 08時00分 公開
[@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 Metaは2023年5月22日(米国時間)、音声技術の対応言語拡大を目指す「Massively Multilingual Speech」(MMS:大規模多言語音声)プロジェクトの成果としてAI(人工知能)モデルとコードをGitHubで公開した。

 音声技術の対応言語を増やすことは、より多くの人々の情報アクセスを向上させる可能性がある。一方、音声技術がサポートする言語は100程度にとどまっていた。これは世界で話されている7000以上の言語のほんの一部だ。しかも、これらの言語の半分以上が、われわれが生きている間に消滅してしまう恐れもある。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。