Google、統合型ドキュメント処理コンソール「Document AI」プラットフォームを発表:ドキュメントから洞察を引き出す
Googleは複雑なドキュメントから構造化データを抽出する際に役立つ統合型ドキュメント処理コンソール「Document AI」プラットフォームを発表した。RPA(Robotic Process Automation)と同様の処理が可能であり、幾つかの定型的な書式については処理手順があらかじめ定義されていて、結果をすぐに確認できる。
Googleは2020年11月5日(米国時間)、統合型ドキュメント処理コンソール「Document AI」(DocAI)プラットフォームを発表し、プレビュー版の提供を開始した。
DocAIプラットフォームは主に3つのドキュメント活用を支援する。
- データの正確性とコンプライアンスを確保
全てのドキュメントを自動化、検証し、コンプライアンスワークフローを効率化する。ドキュメントの処理について勘に頼った作業を減らし、データの正確性とコンプライアンスの維持を実現する。 - ビジネスの意思決定を改善
非構造化ドキュメントから構造化データを抽出する。ユーザーやビジネスアプリケーションが利用できる形にデータ化することで業務効率を高める。 - データを活用して顧客の期待に対応
洞察を活用して顧客の期待に応え、顧客の満足度や支持、生涯価値の向上、支出の拡大につなげる。
DocAIプラットフォームでは、統一されたAPIを用いる。パーサーやツール、「Lending DocAI」「Procurement DocAI」などのソリューションにAPIを使って素早くアクセスでき、評価からデプロイまでの包括的なドキュメントソリューションを実現できる。
ドキュメント処理ワークフローを構築し、カスタマイズすることも容易だという。DocAIプラットフォームに用意されたさまざまな専用パーサーは、Google Cloudであらかじめ定義された分類法を用いて構築されている。そのためユーザーは追加のデータマッピングやトレーニングを施す必要がない。DocAIプラットフォームを使うことでデータ抽出が容易になる。
Googleは、DocAIプラットフォームを立ち上げた背景を次のように説明している。「ドキュメントから構造化データを抽出することで、意思決定を加速し、ビジネス価値を実現したり、顧客エクスペリエンスを向上させたりできる。だがこれまで、こうしたドキュメント活用を大規模に効率良く実践することはできなかった。当社は企業がAIや機械学習を利用して、このプロセスを自動化できるよう支援しており、今回、新プラットフォームをリリースするに至った」
専用画面を通じてドキュメントを処理する
次の画面は、DocAIプラットフォームのメイン選択画面だ。利用できる全てのパーサーが表示されている。Googleは「W9 Parser」(プロセッサ)を利用して請求書を処理する例を挙げて、DocAIプラットフォームの仕組みを紹介している。W9は企業からの要求に応じて、企業にサービスを提供する業者などが記入する米国の税務署向けの書式だ。
「プロセッサ」をどのように使うのか
まずドキュメントプロセッサを作成する必要がある。「Form Parser」(フォームパーサー)などの汎用(はんよう)プロセッサを使ったり、「W9 Parser」(W9パーサー)など専用プロセッサを使ったりできる。汎用プロセッサは一般的なドキュメント向け、専用プロセッサは特定分野のドキュメント向けだ。
プロセッサを作成したら、統合ダッシュボードで内容を確認できる。独自のドキュメントをコンソールに直接アップロードして、プロセッサを試すことも可能だ。次の画面の例では、W9パーサーが住所、口座番号、署名の有無など、ドキュメント内の情報を正確に分類していることが分かる。
請求書の例もある。次の画面では、請求書パーサーがドキュメントからサプライヤー名や請求日、支払期間などの適切なデータを抽出している。
Googleによれば、DocAIプラットフォームの専用パーサーは業界をリードする精度を実現しており、企業が自信を持って機械学習によってドキュメントから洞察を引き出せるように構築され、微調整されているという。
Googleは現在もDocAIプラットフォームの機能追加に取り組んでおり、迅速にDocAIプラットフォームの中核機能を充実させて、より多くのパーサーをサポートしようとしている。
現在公開されているパーサーは、Document OCR(Optical Character Recognition)、Form Parser、Document Splitterといった汎用パーサーだ。W9、「1040」「W2」「1099-MISC」「1003」、請求書、領収書などの専用パーサーについては、アクセスをGoogleにリクエストできる。1040、W2、1099-MISC、1003は、いずれも米国の税務関連書類向けだ。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- Open Images Dataset:Googleによる膨大な画像データセット
データセット「Open Images Dataset」について説明。物体検知用の境界ボックスや、セグメンテーション用のマスク、視覚的な関係性、Localized Narrativesといったアノテーションが施された、約900万枚と非常に膨大な数の画像データセット。その概要と使い方を紹介する。 - 最も嫌われている業務は「一般的なデータ入力」 オートメーション・エニウェアが調査
オートメーション・エニウェアが発表した、「企業におけるデジタルの反復的な管理業務に費やしている時間と、それに対する従業員の姿勢」についての調査結果によると、単純で反復的なデジタル管理業務は本業の妨げとなると考える従業員が過半数を占めた。 - 「高度成長期の成功体験」がDXの邪魔をする 日本企業が今後成功するために必要な3つのカギとは
コロナ禍で初めてテレワークを導入した日本企業は少なくないだろう。コロナ禍はDXの面ではプラスに働くのだろうか。日本企業のDXを難しくしている要因とは何か。デジタルツールを用いた企業変革を専門とするアビームコンサルティングの安部慶喜氏が語った。