お悩みその36 面談に落ちまくり、行き詰まっている(27歳 男性 インフラエンジニア )ふんっ! (荒い鼻息)(4/4 ページ)

» 2024年10月21日 05時00分 公開
[杉山慎@IT]
前のページへ 1|2|3|4       

デバッグbot開発ルーム

 ここからは開発ルームです。前ページまでのゴリラbotの中身は、AIをサポートとして使うほぼ人力のバーチャルAIでした。本ルームでは、バーチャルではなく本物のAIだけで記事全文を生成することを目指し、お悩みデバッグbotの開発状況を報告しています。

 前回は、お悩みデバッグの評価をAIで評価するツールを作成しました。AIによってお悩みデバッグの文章に対して講評と採点を得られましたが、内容はあたかも人間に忖度(そんたく)して褒めそやしているかのような残念な結果でした。

 AIが文章を適切に評価できないことは、AIが作成する文章に対してAI自身の評価をフィードバックしても質が向上しないことから予想通りではありました。それでも、AIによって何かしらの評価を得られることは、文章を執筆する人間にとってニーズがあるのも事実でしょう。

 前回の評価方法では、10点満点で超一流の作家の書いた傑作を基準とする絶対評価でした。しかし、ほとんどが8点と採点され、評価として意味がなかったのは前述の通りです。そこで今回は、絶対評価ではなく、文章同士を比較して良しあしを決める相対評価をしてみます。相対評価であれば、人間への忖度なく冷徹に勝敗が決まり、それを総当たりで実行すれば順位付けもできそうです。

 というわけで、今回はAIによるお悩みデバッグの相対評価を試してみます。

前のページへ 1|2|3|4       

Copyright © ITmedia, Inc. All Rights Reserved.

スポンサーからのお知らせPR

注目のテーマ

Microsoft & Windows最前線2025
AI for エンジニアリング
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。