生成AIの誤回答を9割削減する、学習用データの整形技術をDNPが開発：要素ごとにコンテンツを分割し、学習させる

DNPは、ドキュメントを生成AIの学習に適したデータ形式に整形する技術を開発した。同社の生成AI環境で試したところ、従来の生成AIと比べて誤回答が約90％削減したという。

[＠IT] PC用表示関連情報

LINE

Hatena

　大日本印刷（DNP）は2023年12月14日、ドキュメントを生成AI（人工知能）の学習に適したデータ形式に整形する技術を開発したと発表した。同技術で整形したデータを学習させることで「生成AIの誤回答を減らせる」としている。

DNPのデータ整形技術の概要

少量のデータで学習可能

　DNPが開発したデータ整形技術の特徴は、テキストや画像、表組みなどが混在するドキュメントから、同社独自のAIモデルを使って、要素ごと（タイトルや本文、画像、表の内容など）にコンテンツを分割し、生成AIが学習、参照しやすいデータ形式に整形することだ。

　もう1つの特徴として「学習用のドキュメントがわずかで済むこと」が挙げられる。ドキュメントのレイアウトが違う場合、そのドキュメントの構造をAIモデルに認識（学習）させなければならないが、DNPによると「一般的なディープラーニングのモデルでは数百～数千ページのデータ学習用のドキュメントが必要になる」という。その点、同社のAIモデルは数十ページのドキュメントを学習させるだけで済む。

　DNPが社内に構築した生成AI環境で、社内規定や品質マニュアルなどのドキュメントにこの技術を適用したところ、従来の生成AIと比べて誤回答が約90％減少したという。

整形データを学習した生成AI（左下）と学習していない生成AI（右下）との回答例の比較

　DNPは「この技術を適用した生成AIを利用することで、膨大なマニュアルやドキュメントを参照する審査やコンタクトセンターの問い合わせ対応などの業務で回答精度を高められ、業務を効率化できる」としている。

生成AIの誤回答を9割削減する、学習用データの整形技術をDNPが開発：要素ごとにコンテンツを分割し、学習させる

少量のデータで学習可能

関連記事

関連リンク

Smart & Social 記事ランキング