DNPは、ドキュメントを生成AIの学習に適したデータ形式に整形する技術を開発した。同社の生成AI環境で試したところ、従来の生成AIと比べて誤回答が約90%削減したという。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
大日本印刷(DNP)は2023年12月14日、ドキュメントを生成AI(人工知能)の学習に適したデータ形式に整形する技術を開発したと発表した。同技術で整形したデータを学習させることで「生成AIの誤回答を減らせる」としている。
DNPが開発したデータ整形技術の特徴は、テキストや画像、表組みなどが混在するドキュメントから、同社独自のAIモデルを使って、要素ごと(タイトルや本文、画像、表の内容など)にコンテンツを分割し、生成AIが学習、参照しやすいデータ形式に整形することだ。
もう1つの特徴として「学習用のドキュメントがわずかで済むこと」が挙げられる。ドキュメントのレイアウトが違う場合、そのドキュメントの構造をAIモデルに認識(学習)させなければならないが、DNPによると「一般的なディープラーニングのモデルでは数百〜数千ページのデータ学習用のドキュメントが必要になる」という。その点、同社のAIモデルは数十ページのドキュメントを学習させるだけで済む。
DNPが社内に構築した生成AI環境で、社内規定や品質マニュアルなどのドキュメントにこの技術を適用したところ、従来の生成AIと比べて誤回答が約90%減少したという。
DNPは「この技術を適用した生成AIを利用することで、膨大なマニュアルやドキュメントを参照する審査やコンタクトセンターの問い合わせ対応などの業務で回答精度を高められ、業務を効率化できる」としている。
Copyright © ITmedia, Inc. All Rights Reserved.