Meta、オールインワン型初のマルチモーダル多言語AI翻訳モデル「SeamlessM4T」を発表単一モデルで吹き替え、音声テキスト変換などに対応

Metaは、初のオールインワン型のマルチモーダル多言語AI翻訳モデル「SeamlessM4T」を発表した。

» 2023年08月25日 08時00分 公開
[@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 Metaは2023年8月22日(米国時間)、初のオールインワン型マルチモーダル多言語AI翻訳モデル「SeamlessM4T」(Massive Multilingual Multimodal Machine Translation)を発表した。異なる言語コミュニティーの人々が音声とテキストで簡単にコミュニケーションできるようにするとしている。

 SeamlessM4Tは、101言語の音声入力、96言語のテキスト入出力、35言語の音声出力をカバーしている。この単一モデルは、複数の異なるモデルに依存することなく、以下のタスクを実現する。

  • 音声から音声への翻訳(S2ST)
  • 音声からテキストへの翻訳(S2TT)
  • テキストから音声への翻訳(T2ST)
  • テキストからテキストへの翻訳(T2TT)
  • 自動音声認識(ASR)

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。