生成AIの誤回答を9割削減する、学習用データの整形技術をDNPが開発要素ごとにコンテンツを分割し、学習させる

DNPは、ドキュメントを生成AIの学習に適したデータ形式に整形する技術を開発した。同社の生成AI環境で試したところ、従来の生成AIと比べて誤回答が約90%削減したという。

» 2023年12月22日 08時00分 公開
[@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 大日本印刷(DNP)は2023年12月14日、ドキュメントを生成AI(人工知能)の学習に適したデータ形式に整形する技術を開発したと発表した。同技術で整形したデータを学習させることで「生成AIの誤回答を減らせる」としている。

画像 DNPのデータ整形技術の概要

少量のデータで学習可能

 DNPが開発したデータ整形技術の特徴は、テキストや画像、表組みなどが混在するドキュメントから、同社独自のAIモデルを使って、要素ごと(タイトルや本文、画像、表の内容など)にコンテンツを分割し、生成AIが学習、参照しやすいデータ形式に整形することだ。

 もう1つの特徴として「学習用のドキュメントがわずかで済むこと」が挙げられる。ドキュメントのレイアウトが違う場合、そのドキュメントの構造をAIモデルに認識(学習)させなければならないが、DNPによると「一般的なディープラーニングのモデルでは数百〜数千ページのデータ学習用のドキュメントが必要になる」という。その点、同社のAIモデルは数十ページのドキュメントを学習させるだけで済む。

 DNPが社内に構築した生成AI環境で、社内規定や品質マニュアルなどのドキュメントにこの技術を適用したところ、従来の生成AIと比べて誤回答が約90%減少したという。

画像 整形データを学習した生成AI(左下)と学習していない生成AI(右下)との回答例の比較

 DNPは「この技術を適用した生成AIを利用することで、膨大なマニュアルやドキュメントを参照する審査やコンタクトセンターの問い合わせ対応などの業務で回答精度を高められ、業務を効率化できる」としている。

Copyright © ITmedia, Inc. All Rights Reserved.

スポンサーからのお知らせPR

注目のテーマ

Microsoft & Windows最前線2025
AI for エンジニアリング
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。