Googleは複雑なドキュメントから構造化データを抽出する際に役立つ統合型ドキュメント処理コンソール「Document AI」プラットフォームを発表した。RPA(Robotic Process Automation)と同様の処理が可能であり、幾つかの定型的な書式については処理手順があらかじめ定義されていて、結果をすぐに確認できる。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
Googleは2020年11月5日(米国時間)、統合型ドキュメント処理コンソール「Document AI」(DocAI)プラットフォームを発表し、プレビュー版の提供を開始した。
DocAIプラットフォームは主に3つのドキュメント活用を支援する。
DocAIプラットフォームでは、統一されたAPIを用いる。パーサーやツール、「Lending DocAI」「Procurement DocAI」などのソリューションにAPIを使って素早くアクセスでき、評価からデプロイまでの包括的なドキュメントソリューションを実現できる。
ドキュメント処理ワークフローを構築し、カスタマイズすることも容易だという。DocAIプラットフォームに用意されたさまざまな専用パーサーは、Google Cloudであらかじめ定義された分類法を用いて構築されている。そのためユーザーは追加のデータマッピングやトレーニングを施す必要がない。DocAIプラットフォームを使うことでデータ抽出が容易になる。
Googleは、DocAIプラットフォームを立ち上げた背景を次のように説明している。「ドキュメントから構造化データを抽出することで、意思決定を加速し、ビジネス価値を実現したり、顧客エクスペリエンスを向上させたりできる。だがこれまで、こうしたドキュメント活用を大規模に効率良く実践することはできなかった。当社は企業がAIや機械学習を利用して、このプロセスを自動化できるよう支援しており、今回、新プラットフォームをリリースするに至った」
次の画面は、DocAIプラットフォームのメイン選択画面だ。利用できる全てのパーサーが表示されている。Googleは「W9 Parser」(プロセッサ)を利用して請求書を処理する例を挙げて、DocAIプラットフォームの仕組みを紹介している。W9は企業からの要求に応じて、企業にサービスを提供する業者などが記入する米国の税務署向けの書式だ。
Copyright © ITmedia, Inc. All Rights Reserved.