Google Meetが音声同時通訳に対応 話者の声に似た音声でほぼリアルタイム翻訳が可能にただし、直訳なので「面白い誤解」を招く可能性はある

Googleは、「Google Meet」にリアルタイム音声翻訳機能を追加した。まずはイタリア語、ポルトガル語、ドイツ語、フランス語に対応する。

» 2025年09月19日 08時00分 公開
[@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 Googleは2025年9月11日(米国時間)、オンライン会議サービス「Google Meet」において、音声を即時に翻訳する「Speech Translation」機能を追加したと発表した。この機能を使えば、話した内容を即座に翻訳し、「話者の声に似た音声」で相手に伝えることができる。同社の研究部門をはじめ、DeepMindなど複数のチームが連携して開発した。

翻訳特化型AIで遅延を2〜3秒に短縮

 従来の音声の翻訳機能は「音声を文字に変換し、文字を翻訳し、その文字を合成音声に変換」という段階的な処理を必要とし、10〜20秒の遅延が発生していた。「これでは自然な会話は困難であり、翻訳音声も無機質で発話者の特徴を失っていた」とGoogleは説明。同社は翻訳に特化した言語モデルを使うことでこの課題を解決し、入力音声の処理を2〜3秒で可能にしたという。

 対応言語は2025年9月時点でイタリア語、ポルトガル語、ドイツ語、フランス語の4か国語。ただし、現時点では直訳的な表現にとどまるため、「面白い誤解を招く可能性がある」と指摘している。今後は大規模言語モデル(LLM)の導入によって、文脈や皮肉を含む表現の解釈精度が向上する見込みだ。

このニュースのポイント

Q: Googleが「Google Meet」に追加した新機能は?

A: リアルタイム音声翻訳機能「Speech Translation」で、話者の声に似た音声で翻訳内容を出力できる。リリース時点ではイタリア語、ポルトガル語、ドイツ語、フランス語に対応。

Q: 従来の翻訳機能の課題は何だったか?

A: 音声を文字化、翻訳、合成音声、と段階処理が必要で10〜20秒の遅延が発生し、不自然で無機質な翻訳音声になっていた。

Q: 新機能によって改善された点は?

A: 入力音声を即時処理できるため、2〜3秒で翻訳音声を生成し、声質も話者に近い自然なものになる。

Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ

スポンサーからのお知らせPR

注目のテーマ

4AI by @IT - AIを作り、動かし、守り、生かす
Microsoft & Windows最前線2025
AI for エンジニアリング
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。