ニュース
生成AIの誤りを生成AIが見抜く、OpenAIの「CriticGPT」 その実力とは:「GPT-4」がベース、取り組みの成果や課題を明らかに
OpenAIは同社の「ChatGPT」における応答の誤りを発見する「CriticGPT」を発表した。生成AIが生成AIの誤りを見抜く意義や、構築方法を解説した。
OpenAIは2024年6月27日(米国時間)、同社の生成AI(人工知能)「ChatGPT」における応答の誤りを発見する「CriticGPT」を発表した。CriticGPTは、「GPT-4」をベースとするモデルで、ChatGPTが出力するコードの誤りを発見できるという。
OpenAIは「ChatGPTが生成したコードの人によるレビューにおいて、CriticGPTを使えば、使用しない場合よりも60%の確率でパフォーマンスが向上すると判明した。OpenAIはCriticGPTのようなモデルを私たちのRLHF(Reinforcement Learning from Human Feedback:人間のフィードバックによる強化学習)パイプラインに統合する作業を開始した。これは、AIの学習にAIのサポートを提供することを意味する」と述べている。
生成AIの誤りを生成AIが見抜く意義とは
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- RLHF(人間のフィードバックによる強化学習)とは?
用語「RLHF」について説明。人間のフィードバックを使ってAIモデルを強化学習する手法を指す。OpenAIのChatGPT/InstructGPTでは、人間の価値基準に沿うように、言語モデルをRLHFでファインチューニング(微調整)している。 - 生成AIをアプリケーション開発に活用する企業は、コストやハルシネーションの問題にどう取り組んでいるのか
Amazon Bedrockを早期導入した企業の担当者らが、クラウドのコスト管理からプロンプトの記述に至るまで、アプリケーション開発における生成AI活用のポイントを語った。 - ChatGPTやInstructGPTはなぜユーザーの意図に沿った返答を生成できるのか?
ChatGPTやその前身ともいえるInstructGPTは、GPTとは異なる目的を持ったモデルです。それ故にこれまでとは異なり、ユーザーの意図に沿ったテキストを生成できます。その違いを見てみましょう。