Googleが翻訳APIの機能を強化、「Document Translation」を発表:DOCXやPDFの書式のまま直接翻訳できる
Googleは100以上の言語について、DOCXやPPTX、XLSX、PDF形式のドキュメントを、書式設定やレイアウトといったフォーマットを保持したまま直接翻訳できる機能を発表した。「Cloud Translation」スイートに含まれる「Translation API Advanced」の新機能「Document Translation」(プレビュー版)で実現する。
Googleは2021年5月12日(米国時間)、「Cloud Translation」プロダクトスイートに含まれる「Translation API Advanced」の新機能「Document Translation」(プレビュー版)を発表した。
Cloud Translationは、Googleの機械学習モデルを使用して言語間の翻訳を動的に進めるもの。このスイートに含まれる最も基本的なプロダクトである「Translation API Basic」は、Webサイトやアプリケーションの表示を100以上の言語へ瞬時に翻訳できる。Translation API Advancedでは、Basicの機能に加えて、カスタマイズによって分野固有やコンテキスト固有の用語やフレーズに対応できる。
Translation API Advancedの新しいDocument Translation機能では、100以上の言語について、DOCXやPPTX、XLSX、PDF形式のドキュメントを、書式設定やレイアウトといったフォーマットを保持したまま直接翻訳できる。
リアルタイムオンライン翻訳が可能
Document Translation機能の特徴の一つは、単一ファイルのリアルタイム(同期処理)オンライン翻訳が可能なことだ。例えば、人事書類などのビジネスドキュメントを翻訳する場合、オンライン翻訳により、小規模なファイルを高速に翻訳できる。PDFの場合、ファイルサイズが20MBまで、ページ数は20ページまで対応できる。他のドキュメントタイプの場合、ファイルサイズは20MBまでで、ページ数に制限はない。
「REST」(REpresentational State Transfer)または「gRPC」によってDocument Translation APIをモバイルまたはWebアプリケーションと簡単に連携させ、瞬時に翻訳することも可能だ。
AutoML Translationを用いたカスタム翻訳も
Googleマネージドモデルの代わりに独自の「AutoML Translation」モデルを使って、ドキュメントを翻訳することもできる。AutoML Translationは、Cloud Translationスイートに含まれるプロダクトの一つ。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- AIプロジェクトの成否は「MLOps(機械学習基盤)」にかかっている
人工知能(AI)を活用して価値を提供する企業が現れる中、PoCでつまずく企業が見直すべきポイントはどこにあるのか。そして今後必要不可欠になる考え方とは何か。機械学習に必要な教師データを企業に提供するLionbridgeに話を聞いた。 - クラウド「AI」API入門:AWS/Cognitive Services/Google Cloud/IBM Watsonの比較
「AWS AIサービス」「Azure Cognitive Services」「Google Cloud AIビルディングブロック」「IBM Watson API」という主要AIサービスの一覧表を示し、各サービスを1行程度で説明する。自分でAI/機械学習モデルを作る前に、既存のAIサービスがないか(カスタマイズできないか)を、これで確認しよう。 - オープンソースのドキュメントをいち早く日本語化、NICTがAI自動翻訳技術をLinux Foundationに提供
NICTは、Linux Foundation Japanに「みんなの自動翻訳」のAI自動翻訳技術を提供した。Linux Foundationは、オープンソースプロジェクトのドキュメント翻訳作業に同技術を活用する。