ニュース
Meta、オールインワン型初のマルチモーダル多言語AI翻訳モデル「SeamlessM4T」を発表:単一モデルで吹き替え、音声テキスト変換などに対応
Metaは、初のオールインワン型のマルチモーダル多言語AI翻訳モデル「SeamlessM4T」を発表した。
Metaは2023年8月22日(米国時間)、初のオールインワン型マルチモーダル多言語AI翻訳モデル「SeamlessM4T」(Massive Multilingual Multimodal Machine Translation)を発表した。異なる言語コミュニティーの人々が音声とテキストで簡単にコミュニケーションできるようにするとしている。
SeamlessM4Tは、101言語の音声入力、96言語のテキスト入出力、35言語の音声出力をカバーしている。この単一モデルは、複数の異なるモデルに依存することなく、以下のタスクを実現する。
- 音声から音声への翻訳(S2ST)
- 音声からテキストへの翻訳(S2TT)
- テキストから音声への翻訳(T2ST)
- テキストからテキストへの翻訳(T2TT)
- 自動音声認識(ASR)
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- Google、OSS向けファジングサービス「OSS-Fuzz」をLLMで改善
Googleは、同社の大規模言語モデルを利用して、オープンソースソフトウェア向けファジングサービス「OSS-Fuzz」の対象プロジェクトのコードカバレッジを高めることに成功した。 - 生成AIはやっぱり「過度な期待」、人工知能やブロックチェーンは「啓発期」に移行 ハイプ・サイクル最新版
ガートナージャパンは、「日本における未来志向型インフラテクノロジーのハイプ・サイクル:2023年」を発表した。新たに「生成AI」「分散型アイデンティティー」など9項目の技術やトレンドが追加された。 - Meta、商用利用可能なオープンソースLLM「Llama 2」を提供開始 「MPT」や「Falcon」を上回る成績
Metaは、次世代のオープンソース大規模言語モデル「Llama 2」を提供開始した。研究および商用に無料で利用できる。