検索
ニュース

Googleが文書処理AIプラットフォーム「Document AI Workbench」を一般公開、より少ないデータでモデルを構築可能にあらゆるドキュメントからデータを抽出、モデル構築が容易に

Googleは2023年2月22日、文書処理のためのAIプラットフォームであるDocument AI Workbenchの一般公開を発表した。

Share
Tweet
LINE
Hatena

 Googleは2023年2月22日(米国時間)、文書処理のためのAIプラットフォームである「Document AI Workbench」の一般公開を発表した。これにより、全ての顧客がAPIと「Google Cloud Console」を通じて製品の利用が可能となった。

 Document AI Workbench にはGoogle Cloud Next '22で発表したDocument AI Workbenchの最初のモデル「Custom Document Extractor」(CDE)が導入されている。CDEは、事実上あらゆるドキュメントベースのワークフローに機械学習を適用して、非構造化ドキュメントタイプから構造化データを抽出し、ビジネスプロセスの自動化を迅速かつ容易に実現するという。

 CDEでは、開発者やアナリストが自身のデータを使用してモデルをトレーニングすることにより、ビジネスドキュメントからフィールドを抽出できる。少ないデータで迅速にモデルを構築し、ドキュメント内のデータの処理と分析を価値につなげるまでの時間を短縮できるという。

「高い精度のモデルを迅速に構築できる」

 ユーザーはDocument AI Workbenchを活用することで、時間とコストを削減することができるとGoogle Cloudは主張する。第三者機関による評価では、可変レイアウトのドキュメントタイプ(例:請求書、領収書、銀行明細書、給与明細書)において、複数の競合製品よりも正確にデータを抽出できたという。また、モデルの訓練スピードについても、主要な競合他社に比べ最大3倍高速だったとしている。

Document AI Workbenchの新着情報

 最新のDocument AI Workbenchの機能により、抽出モデルのトレーニングやデプロイがより簡単になった。

  • Workbenchの公開APIを使うことで、プログラムによるモデルの作成、削除、トレーニング、評価、デプロイが可能に
  • 更新されたデータセット管理ツールは、事前にアノテーションされたドキュメントから既存のスキーマラベルを自動的に検出、作成する。また、スキーマを作成、管理する際に、より柔軟な対応が可能
  • 新しいDocAIツールキットには、ラベル付き文書変換ツールが含まれており、ラベル付き文書をDocAIのフォーマットに簡単に変換して、より早くトレーニングを開始することができる
  • ラベリングUIの効率化により、ラベリング担当者の認識負荷を軽減
  • 刷新されたプロセッサギャラリーは、ユースケースに最適なモデルを素早く特定するのに役立つ

Document AI Workbenchの今後について

 Googleは顧客が文書処理を自動化できるよう、Document AI Workbenchに投資を続ける方針を示している。

  • カスタム文書分類器(CDC)で文書の種類を分類する(近日公開予定)
  • プロジェクトやプロセッサ間でプロセッサのバージョンをコピーし、開発環境と本番環境の管理を効率化する
  • 50ページを超えるような大きな原稿にも対応し、より多くの原稿を処理することができるようにする
  • より広範な言語(非ラテン語)サポート――Document AI OCRと同等
  • さらに多くの投資を行い、最先端のテクノロジーを駆使して、ワールドクラスのモデルをより速く構築し、文書処理の自動化を支援する

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る