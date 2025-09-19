この記事は会員限定です。会員登録（無料）すると全てご覧いただけます。

Googleは2025年9月11日（米国時間）、オンライン会議サービス「Google Meet」において、音声を即時に翻訳する「Speech Translation」機能を追加したと発表した。この機能を使えば、話した内容を即座に翻訳し、「話者の声に似た音声」で相手に伝えることができる。同社の研究部門をはじめ、DeepMindなど複数のチームが連携して開発した。

従来の音声の翻訳機能は「音声を文字に変換し、文字を翻訳し、その文字を合成音声に変換」という段階的な処理を必要とし、10〜20秒の遅延が発生していた。「これでは自然な会話は困難であり、翻訳音声も無機質で発話者の特徴を失っていた」とGoogleは説明。同社は翻訳に特化した言語モデルを使うことでこの課題を解決し、入力音声の処理を2〜3秒で可能にしたという。

対応言語は2025年9月時点でイタリア語、ポルトガル語、ドイツ語、フランス語の4か国語。ただし、現時点では直訳的な表現にとどまるため、「面白い誤解を招く可能性がある」と指摘している。今後は大規模言語モデル（LLM）の導入によって、文脈や皮肉を含む表現の解釈精度が向上する見込みだ。