Googleが文書処理AIプラットフォーム「Document AI Workbench」を一般公開、より少ないデータでモデルを構築可能に:あらゆるドキュメントからデータを抽出、モデル構築が容易に
Googleは2023年2月22日、文書処理のためのAIプラットフォームであるDocument AI Workbenchの一般公開を発表した。
Googleは2023年2月22日(米国時間)、文書処理のためのAIプラットフォームである「Document AI Workbench」の一般公開を発表した。これにより、全ての顧客がAPIと「Google Cloud Console」を通じて製品の利用が可能となった。
Document AI Workbench にはGoogle Cloud Next '22で発表したDocument AI Workbenchの最初のモデル「Custom Document Extractor」(CDE)が導入されている。CDEは、事実上あらゆるドキュメントベースのワークフローに機械学習を適用して、非構造化ドキュメントタイプから構造化データを抽出し、ビジネスプロセスの自動化を迅速かつ容易に実現するという。
CDEでは、開発者やアナリストが自身のデータを使用してモデルをトレーニングすることにより、ビジネスドキュメントからフィールドを抽出できる。少ないデータで迅速にモデルを構築し、ドキュメント内のデータの処理と分析を価値につなげるまでの時間を短縮できるという。
「高い精度のモデルを迅速に構築できる」
ユーザーはDocument AI Workbenchを活用することで、時間とコストを削減することができるとGoogle Cloudは主張する。第三者機関による評価では、可変レイアウトのドキュメントタイプ(例:請求書、領収書、銀行明細書、給与明細書)において、複数の競合製品よりも正確にデータを抽出できたという。また、モデルの訓練スピードについても、主要な競合他社に比べ最大3倍高速だったとしている。
Document AI Workbenchの新着情報
最新のDocument AI Workbenchの機能により、抽出モデルのトレーニングやデプロイがより簡単になった。
- Workbenchの公開APIを使うことで、プログラムによるモデルの作成、削除、トレーニング、評価、デプロイが可能に
- 更新されたデータセット管理ツールは、事前にアノテーションされたドキュメントから既存のスキーマラベルを自動的に検出、作成する。また、スキーマを作成、管理する際に、より柔軟な対応が可能
- 新しいDocAIツールキットには、ラベル付き文書変換ツールが含まれており、ラベル付き文書をDocAIのフォーマットに簡単に変換して、より早くトレーニングを開始することができる
- ラベリングUIの効率化により、ラベリング担当者の認識負荷を軽減
- 刷新されたプロセッサギャラリーは、ユースケースに最適なモデルを素早く特定するのに役立つ
Document AI Workbenchの今後について
Googleは顧客が文書処理を自動化できるよう、Document AI Workbenchに投資を続ける方針を示している。
- カスタム文書分類器(CDC)で文書の種類を分類する(近日公開予定)
- プロジェクトやプロセッサ間でプロセッサのバージョンをコピーし、開発環境と本番環境の管理を効率化する
- 50ページを超えるような大きな原稿にも対応し、より多くの原稿を処理することができるようにする
- より広範な言語(非ラテン語)サポート――Document AI OCRと同等
- さらに多くの投資を行い、最先端のテクノロジーを駆使して、ワールドクラスのモデルをより速く構築し、文書処理の自動化を支援する
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- Googleらが共同開発、AI/機械学習を支援するオープンソース技術「OpenXLA」とは
AI/ML業界の多くの主要企業が共同開発しているオープンソースMLコンパイラエコシステム「OpenXLA」の利用と貢献が可能になった。 - ChatGPTのようなエージェントを開発できる? 大規模言語モデルを活用可能なPaaS「Fixie.ai」登場
Fixie.aiは、大規模言語モデルを活用できるPaaS「Fixie.ai」を発表した。 - Google Cloud、BigQueryの非構造化データサポートや「Vertex AI Vision」を発表
Google CloudはGoogle Cloud Next '22で、「BigLake」のデータ形式サポートを強化し、「BigQuery」では非構造化データに対応、「Vertex AI」では動画を使った機械学習アプリケーション開発を効率化する「Vertex AI Vision」を発表した。