Google、クラウドで動作するAIベースのドキュメント処理プラットフォーム「Document AI」を正式リリース:業務文書の処理時間や処理コストを大幅に低減
GoogleはAIと機械学習を利用した統合型ドキュメント処理コンソール「Document AI」プラットフォームと、これに基づく住宅ローンドキュメント処理の高速化ソリューション、大規模な調達関連データ収集処理の自動化ソリューションの一般提供をGoogle Cloudで開始した。
Googleは2021年4月21日(米国時間)、AIと機械学習を利用した統合型ドキュメント処理コンソール「Document AI」(DocAI)プラットフォームと、これに基づく住宅ローンドキュメント処理の高速化ソリューション「Lending DocAI」、大規模な調達関連データ収集処理の自動化ソリューション「Procurement DocAI」の一般提供をGoogle Cloudで開始した。
これらのDoc AIは次のようなGoogleの技術と組み合わせることで、ドキュメントを読み取り、理解して、活用できる。
- (OCRを含む)コンピュータビジョンと自然言語処理(NLP):価値の高い大量のドキュメントについてトレーニング済みモデルを作成
- Google Knowledge Graph:さまざまな分野の専門的な観点から分析情報を検証し、改善
- カスタムドキュメントモデルのトレーニングと作成
- AI開発における学習への人間の関与:必要な場合に高い精度を確保
プレビュー版でも業務プロセスを改善できた
DocAIプラットフォームとLending DocAI、Procurement DocAIは2020年11月の発表後、プレビュー版を数千の組織が試用してきた。DocAIは既にローンや保険、政府機関といった業種の数百億ページのドキュメントを処理している。
Lending DocAIも、銀行や住宅ローンブローカーなどの融資機関が、ローン申請の処理プロセスを改善する役に立っている。具体的には処理に必要な時間が数週間から数日に短縮できたという。Procurement DocAIは、調達データの大規模な収集を企業が自動化し、処理コストを最大60%削減することを可能にしている。
Lending DocAIとProcurement DocAIの基盤であるDocAIは、特定のタイプのドキュメントから情報を抽出するためのさまざまな「プロセッサ」(機能によってパーサーやスプリッターとも呼ばれる)を提供する。
非構造化データ(ドキュメントや電子メールなど)を取り込み、コンテンツ分類やエンティティー抽出、高度な検索などによって構造を提示でき、これらのデータの理解や分析、活用を容易にする。DocAIを使ったドキュメントの自動化や検証により、ワークフローの効率化や推測の削減、データの正確性とコンプライアンスの確保が可能になる。
企業に向け、特定分野向けソリューションに注力
企業がAI投資から最大限の価値を引き出せるよう支援する特定分野向けソリューションの開発は、Google Cloudの戦略の柱となっている。Lending DocAIとProcurement DocAIの投入は、この戦略に沿っている。これらのソリューションのために、専用の機械学習モデルやパーサーを採用している。
DocAIの一般提供に先立ち、Googleは2021年4月20日(米国時間)に、住宅ローン業界におけるAI活用を支援する目的で、住宅ローンサービス大手のMr. Cooper Groupと提携したことを発表している。Mr. Cooper Groupのコア住宅ローンプラットフォームのデジタル化や、AIを用いたパーソナルな顧客体験の構築などに共同で取り組むとしている。
人間参加型AI機能もリリース
GoogleはDocAIの新しい「Human-in-the-Loop AI」(人間参加型AI)機能の一般提供開始も発表した。この機能は、企業が人間のレビューを取り入れ、ドキュメントの処理精度を高めることができるよう支援する。
人間がレビューすることで、DocAIの精度が向上するため、企業がこうしたレビュー用のツールを使って行うAIの予測の解釈に役立つ。
ドキュメント処理ではスピードと費用対効果が重要だが、コンプライアンス上、データの正確性の高度な保証が必要な場合も多いことから、Human-in-the-Loop AIが新たに提供されることになった。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- Google、統合型ドキュメント処理コンソール「Document AI」プラットフォームを発表
Googleは複雑なドキュメントから構造化データを抽出する際に役立つ統合型ドキュメント処理コンソール「Document AI」プラットフォームを発表した。RPA(Robotic Process Automation)と同様の処理が可能であり、幾つかの定型的な書式については処理手順があらかじめ定義されていて、結果をすぐに確認できる。 - Open Images Dataset:Googleによる膨大な画像データセット
データセット「Open Images Dataset」について説明。物体検知用の境界ボックスや、セグメンテーション用のマスク、視覚的な関係性、Localized Narrativesといったアノテーションが施された、約900万枚と非常に膨大な数の画像データセット。その概要と使い方を紹介する。 - 最も嫌われている業務は「一般的なデータ入力」 オートメーション・エニウェアが調査
オートメーション・エニウェアが発表した、「企業におけるデジタルの反復的な管理業務に費やしている時間と、それに対する従業員の姿勢」についての調査結果によると、単純で反復的なデジタル管理業務は本業の妨げとなると考える従業員が過半数を占めた。