生成AIの誤回答を9割削減する、学習用データの整形技術をDNPが開発：要素ごとにコンテンツを分割し、学習させる

DNPは、ドキュメントを生成AIの学習に適したデータ形式に整形する技術を開発した。同社の生成AI環境で試したところ、従来の生成AIと比べて誤回答が約90％削減したという。

» 2023年12月22日 08時00分公開

[＠IT]

この記事は会員限定です。会員登録（無料）すると全てご覧いただけます。

　大日本印刷（DNP）は2023年12月14日、ドキュメントを生成AI（人工知能）の学習に適したデータ形式に整形する技術を開発したと発表した。同技術で整形したデータを学習させることで「生成AIの誤回答を減らせる」としている。

DNPのデータ整形技術の概要

少量のデータで学習可能

　DNPが開発したデータ整形技術の特徴は、テキストや画像、表組みなどが混在するドキュメントから、同社独自のAIモデルを使って、要素ごと（タイトルや本文、画像、表の内容など）にコンテンツを分割し、生成AIが学習、参照しやすいデータ形式に整形することだ。

　もう1つの特徴として「学習用のドキュメントがわずかで済むこと」が挙げられる。ドキュメントのレイアウトが違う場合、そのドキュメントの構造をAIモデルに認識（学習）させなければならないが、DNPによると「一般的なディープラーニングのモデルでは数百～数千ページのデータ学習用のドキュメントが必要になる」という。その点、同社のAIモデルは数十ページのドキュメントを学習させるだけで済む。

　DNPが社内に構築した生成AI環境で、社内規定や品質マニュアルなどのドキュメントにこの技術を適用したところ、従来の生成AIと比べて誤回答が約90％減少したという。

整形データを学習した生成AI（左下）と学習していない生成AI（右下）との回答例の比較

　DNPは「この技術を適用した生成AIを利用することで、膨大なマニュアルやドキュメントを参照する審査やコンタクトセンターの問い合わせ対応などの業務で回答精度を高められ、業務を効率化できる」としている。

「企業の重役」こそセキュリティ対策が不十分？　経営幹部を狙うサイバー攻撃を防ぐ5つの対策法　ESET
企業内で大きな権限を持つ経営幹部は、セキュリティ攻撃者の標的となることも多い。ESETは、経営幹部にセキュリティ対策の重要性や取り組みを強化してもらうための5つの対策法を解説した。
あなたの会社に「レッドチーム」はありますか？　実践形式のセキュリティ評価サービスの需要が高まる
ITRは、国内レッドチームサービス市場の規模推移と予測を発表した。2022年度の売上金額は、対2021年度比で30.9ポイント増の28億8000万円。2022～2027年度の年平均成長率を11.1％と見込み、「2027年度の売上金額は約49億円に上る」と予測している。
「コンテナやKubernetesの活用は広まっているが、セキュリティの成熟度は低い」　Wiz
セキュリティ企業のWizは「2023 Kubernetes Security Report」を発表した。20万を超えるクラウドアカウントを対象に、Kubernetesセキュリティの取り組み状況を調査した結果を明らかにしている。