ここからは開発ルームです。前ページまでのお嬢さまbotの中身は、AIをサポートとして使うほぼ人力のバーチャルAIでした。本ルームでは、バーチャルではなく本物のAIだけで記事全文を生成することを目指し、お悩みデバッグbotの開発状況を報告しています。
前回、Cohereの「Command-R+」、OpenAIの「GPT-4o」、Googleの「Gemini 1.5 Pro」という3つの大規模言語モデル(MML)でお悩みデバッグ性能の頂上決戦をしました。結果は、キャラクター表現と人間の心の洞察力はGPT-4o、比喩など創造性ある表現はCommand-R+が優れる、という内容でした。現在のAI環境は一強時代ではないので、大規模言語モデルをそれぞれの得意分野で使い分けていく方針が良さそうです。
今回は、お悩みデバッグbotの開発に戻ります。どんなAIでも手直しなしで読むに値する文章はまだ生成できない、という前提で人間の文章作成をサポートするツールにAIを活用する開発を進めてきました。
Copyright © ITmedia, Inc. All Rights Reserved.