検索
ニュース

Google、統合型ドキュメント処理コンソール「Document AI」プラットフォームを発表ドキュメントから洞察を引き出す

Googleは複雑なドキュメントから構造化データを抽出する際に役立つ統合型ドキュメント処理コンソール「Document AI」プラットフォームを発表した。RPA(Robotic Process Automation)と同様の処理が可能であり、幾つかの定型的な書式については処理手順があらかじめ定義されていて、結果をすぐに確認できる。

Share
Tweet
LINE
Hatena

 Googleは2020年11月5日(米国時間)、統合型ドキュメント処理コンソール「Document AI」(DocAI)プラットフォームを発表し、プレビュー版の提供を開始した。

 DocAIプラットフォームは主に3つのドキュメント活用を支援する。

  • データの正確性とコンプライアンスを確保
      全てのドキュメントを自動化、検証し、コンプライアンスワークフローを効率化する。ドキュメントの処理について勘に頼った作業を減らし、データの正確性とコンプライアンスの維持を実現する。
  • ビジネスの意思決定を改善
     非構造化ドキュメントから構造化データを抽出する。ユーザーやビジネスアプリケーションが利用できる形にデータ化することで業務効率を高める。
  • データを活用して顧客の期待に対応
     洞察を活用して顧客の期待に応え、顧客の満足度や支持、生涯価値の向上、支出の拡大につなげる。

 DocAIプラットフォームでは、統一されたAPIを用いる。パーサーやツール、「Lending DocAI」「Procurement DocAI」などのソリューションにAPIを使って素早くアクセスでき、評価からデプロイまでの包括的なドキュメントソリューションを実現できる。

 ドキュメント処理ワークフローを構築し、カスタマイズすることも容易だという。DocAIプラットフォームに用意されたさまざまな専用パーサーは、Google Cloudであらかじめ定義された分類法を用いて構築されている。そのためユーザーは追加のデータマッピングやトレーニングを施す必要がない。DocAIプラットフォームを使うことでデータ抽出が容易になる。

 Googleは、DocAIプラットフォームを立ち上げた背景を次のように説明している。「ドキュメントから構造化データを抽出することで、意思決定を加速し、ビジネス価値を実現したり、顧客エクスペリエンスを向上させたりできる。だがこれまで、こうしたドキュメント活用を大規模に効率良く実践することはできなかった。当社は企業がAIや機械学習を利用して、このプロセスを自動化できるよう支援しており、今回、新プラットフォームをリリースするに至った」

専用画面を通じてドキュメントを処理する

 次の画面は、DocAIプラットフォームのメイン選択画面だ。利用できる全てのパーサーが表示されている。Googleは「W9 Parser」(プロセッサ)を利用して請求書を処理する例を挙げて、DocAIプラットフォームの仕組みを紹介している。W9は企業からの要求に応じて、企業にサービスを提供する業者などが記入する米国の税務署向けの書式だ。


パーサーのメイン選択画面(出典:Google

「プロセッサ」をどのように使うのか

 まずドキュメントプロセッサを作成する必要がある。「Form Parser」(フォームパーサー)などの汎用(はんよう)プロセッサを使ったり、「W9 Parser」(W9パーサー)など専用プロセッサを使ったりできる。汎用プロセッサは一般的なドキュメント向け、専用プロセッサは特定分野のドキュメント向けだ。

 プロセッサを作成したら、統合ダッシュボードで内容を確認できる。独自のドキュメントをコンソールに直接アップロードして、プロセッサを試すことも可能だ。次の画面の例では、W9パーサーが住所、口座番号、署名の有無など、ドキュメント内の情報を正確に分類していることが分かる。


W9パーサーの解析結果を表示したメイン選択画面(出典:Google

 請求書の例もある。次の画面では、請求書パーサーがドキュメントからサプライヤー名や請求日、支払期間などの適切なデータを抽出している。


請求書パーサーの解析結果(出典:Google

 Googleによれば、DocAIプラットフォームの専用パーサーは業界をリードする精度を実現しており、企業が自信を持って機械学習によってドキュメントから洞察を引き出せるように構築され、微調整されているという。

 Googleは現在もDocAIプラットフォームの機能追加に取り組んでおり、迅速にDocAIプラットフォームの中核機能を充実させて、より多くのパーサーをサポートしようとしている。

 現在公開されているパーサーは、Document OCR(Optical Character Recognition)、Form Parser、Document Splitterといった汎用パーサーだ。W9、「1040」「W2」「1099-MISC」「1003」、請求書、領収書などの専用パーサーについては、アクセスをGoogleにリクエストできる。1040、W2、1099-MISC、1003は、いずれも米国の税務関連書類向けだ。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る