ここからは開発ルームです。前ページまでのデバッグbotの中身は、AIをサポートとして使うほぼ人力のバーチャルAIでした。バーチャルではなく本物のAIだけで動かすことを目指し、お悩みデバッグbotの開発状況を報告していきます。
これまでの開発ルームでAIとして使ってきたのは、OpenAIの「ChatGPT」でした。大規模言語モデルのAIとしてはOpenAIの独壇場ですが、その対抗馬の筆頭として注目されるGoogleの「Gemini」が先日公開されました。
大規模言語モデルの評価にはさまざまな尺度がありますが、デバッグbot開発で重視してきたのは、エンジニアへ親身に寄り添えるようなキャラクター性と、お悩みの深層にあって解決の支障になっている心のバグの発見などの洞察力です。もしGeminiがキャラクター性と洞察力、つまりお悩みデバッグ力に優れているならば、ChatGPTから切り替えるべきかもしれません。
ということで今回は、Geminiのモデルの一つでAPIが公開されたミドルサイズモデル「Gemini Pro」を使って、ChatGPTのモデル「GPT-4 Turbo」とお悩みデバッグ力を比較してみます。
Copyright © ITmedia, Inc. All Rights Reserved.