Googleが翻訳APIの機能を強化、「Document Translation」を発表DOCXやPDFの書式のまま直接翻訳できる

Googleは100以上の言語について、DOCXやPPTX、XLSX、PDF形式のドキュメントを、書式設定やレイアウトといったフォーマットを保持したまま直接翻訳できる機能を発表した。「Cloud Translation」スイートに含まれる「Translation API Advanced」の新機能「Document Translation」(プレビュー版)で実現する。

» 2021年05月14日 14時00分 公開
[@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 Googleは2021年5月12日(米国時間)、「Cloud Translation」プロダクトスイートに含まれる「Translation API Advanced」の新機能「Document Translation」(プレビュー版)を発表した。

 Cloud Translationは、Googleの機械学習モデルを使用して言語間の翻訳を動的に進めるもの。このスイートに含まれる最も基本的なプロダクトである「Translation API Basic」は、Webサイトやアプリケーションの表示を100以上の言語へ瞬時に翻訳できる。Translation API Advancedでは、Basicの機能に加えて、カスタマイズによって分野固有やコンテキスト固有の用語やフレーズに対応できる。

 Translation API Advancedの新しいDocument Translation機能では、100以上の言語について、DOCXやPPTX、XLSX、PDF形式のドキュメントを、書式設定やレイアウトといったフォーマットを保持したまま直接翻訳できる。

リアルタイムオンライン翻訳が可能

 Document Translation機能の特徴の一つは、単一ファイルのリアルタイム(同期処理)オンライン翻訳が可能なことだ。例えば、人事書類などのビジネスドキュメントを翻訳する場合、オンライン翻訳により、小規模なファイルを高速に翻訳できる。PDFの場合、ファイルサイズが20MBまで、ページ数は20ページまで対応できる。他のドキュメントタイプの場合、ファイルサイズは20MBまでで、ページ数に制限はない。

 「REST」(REpresentational State Transfer)または「gRPC」によってDocument Translation APIをモバイルまたはWebアプリケーションと簡単に連携させ、瞬時に翻訳することも可能だ。

RESTやgRPCを用いて他のWebアプリケーションなどと連携できる(出典:Google

AutoML Translationを用いたカスタム翻訳も

 Googleマネージドモデルの代わりに独自の「AutoML Translation」モデルを使って、ドキュメントを翻訳することもできる。AutoML Translationは、Cloud Translationスイートに含まれるプロダクトの一つ。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。