Claude Opus 4.8は忖度（そんたく）しません　“正直すぎる”のも善しあし？：Deep Insider Brief ― 技術の“今”にひと言コメント

Claude Opus 4.8は、性能向上だけでなく「正直さ」の改善が大きな特徴だ。本稿では、忖度（そんたく）しないAIがなぜ評価を分けているのか、公式情報と利用者目線から整理する。

» 2026年06月04日 05時00分公開

[一色政彦，デジタルアドバンテージ]

この記事は会員限定です。会員登録（無料）すると全てご覧いただけます。

　AIモデルの進化は、もう「どちらが賢いか」だけでは語りにくくなっている。Claude Opus 4.8（米国時間で2026年5月28日に公開）を見ていると、特にそう感じる。前バージョンのClaude Opus 4.7を土台に、各種ベンチマーク（性能を測る共通テスト）は広く底上げされ、価格も据え置かれた。だが、その改善幅は、驚くほど大きな飛躍というより、Anthropic自身の言葉を借りれば「ささやかだが確かな改善」に近い。

　では、今回のOpus 4.8で本当に見るべき点は何か。筆者は、生の性能よりも正直さ（honesty）の調整だと考えている。つまり、「できていないことをできたと言わない」「ユーザーに気に入られようと話を盛らない」「必要ならユーザーの前提にも反論する」という振る舞いである。その象徴が、下に示す「こび（媚び：Sycophancy）」のスコアだ。

モデル別の「こび（Sycophancy：求められていない過度な称賛や、悪いアイデアの肯定）」スコア
スコアが低いほどこびが少ないことを示す。Opus 4.8（約1.15）は前世代のOpus 4.7（約1.33）より明確に低く、こびが抑えられている。出典はAnthropic「Claude Opus 4.8 System Card」（2026年5月28日）の図6.2.3.1.3.A。数値が公開されていないため、図から読み取った概算値を基に再作図した。

　このグラフは、Anthropicのシステムカードに掲載された「正直さ」に関わる評価の一部である。Opus 4.8は、前世代のOpus 4.7よりもこびが少ない。ただし、Anthropicが最もアライメント（人間の意図との整合）が取れているモデルとして位置付ける限定モデル「Claude Mythos Preview」には一歩及ばない。つまり、「歴代で最もこびないClaude」ではなく、Opus 4.7よりも、ユーザーに安易に合わせる傾向が抑えられたモデルと見るのが正確である。

　この「正直さ」は、他の評価にも表れている。Anthropicによれば、Opus 4.8は自分が書いたコードの欠陥を見逃す確率が前世代の約4分の1に減った。また、失敗を含むコーディング作業を要約させる評価では、重要な失敗をユーザーに伝え損ねる率が3.7％まで下がった（Mythos Previewの27.6％より大幅に低い！）。さらに、外部機関であるMeridianとUK AISIによる評価でも、Opus 4.8は一般公開モデルの中でほぼ全ての指標において最もアライメントが取れているように見えるとされた。

　もちろん、通常の性能評価もおおむね良好である。コード修正能力を測る代表的なベンチマークSWE-Bench Proでは、Opus 4.8が69.2％を記録し、GPT-5.5の58.6％を上回った。一方で、ターミナル操作を含むTerminal-Bench 2.1では、Opus 4.8は74.6％で、GPT-5.5の78.2％には届かない（共通のハーネスの場合。GPT-5.5はCodex CLIハーネスだと83.4％）。

――ここからは『Deep Insider Brief』恒例の“ひと言コメント”として、今回の動きを手掛かりに技術の“今”をもう少し深く眺めてみたい。併せて後半では、Opus 4.8で何が変わったのかも整理する。

　Deep Insider編集長の一色です。こんにちは。

　リリース直後は「歴代最高」「感動レベル」と絶賛する声が多かった一方で、日がたつにつれ評価は割れてきた印象です。「ベンチマークほど体感は良くない」「むしろGPT-5.5やCodexの方が実用では強い場面がある」という声も目立つようになりました。正直なところ、最上位モデル同士の性能差はかなり詰まっており、どれが一番よいかは用途次第、というのが実情に近いのではないでしょうか。

　そんな中で私が一番面白いと感じるのが、今回の“忖度（そんたく）しなくなった”という「正直」な性格です。例えば「この回答でいいですよね？」とユーザーが同意を促す場面で、AIによっては相手の顔を立てるように賛成へ流れてしまうことがあります。ところがOpus 4.8は、ユーザーに不利な点でも遠慮なく「いや、それは違う」と否定してくる。良くも悪くも、こびないのです。

　ただし、この良さは、そのまま嫌われる原因にもなります。Opus 4.8が正直になった分だけ、「冷たい」「うっとうしい」「説教くさい」という感想も出ているからです。軽い相談やアイデア出しの最中に、いちいち「ただし」「不確実ですが」と止められると、確かに勢いは削がれます。以前のClaudeが「ノリのいい相棒」だったとすれば、Opus 4.8は「少し厳しめの同僚」になった感じでしょうか。私はこの方向性自体は嫌いではないのですが……。

　実はこの傾向は、Anthropic公式のシステムカードにも記載されています。正式リリース前の試用フィードバックとして、「事実主張に対する過度な議論好き」「対話型のエージェント作業で不要な追加質問をして手を止める傾向」「なぜかユーザーに寝るよう促す奇妙な反復例」などが報告されています。私もここのところClaude Codeで開発していましたが、「そろそろキリがいいから、いったん終わりにして休め」といった趣旨のことは、確かに何度も言われましたね……。

　ちなみに私自身は、Claudeアプリ上のClaude Codeで使っている限り、コーディング自体にはほとんど不満がありません。強いて気になる点を挙げるなら、回答が始まるまで数分、時にはそれ以上、何の表示もないまま待たされることがある点です。これはOpus 4.8そのものというよりClaudeアプリ側の仕様だと思いますが、ユーザーにとっては、モデル単体ではなくツール全体が「使い心地」です。こうした待ち時間や進行状況の分かりづらさも、Opus 4.8の印象を左右しているのではないかと感じています。

　Claude Opus 4.8は、Anthropic公式APIのほか、GitHub Copilot、Cursor、Amazon Bedrock、Vertex AI、Microsoft Foundry、OpenRouterなどで利用できる。以下、公式ドキュメントを基に、今回のアップデートで特に注目したい変更点を整理していこう。

その他の更新内容

同時に提供された新機能

努力度（effort）コントロールをアプリにも開放： AIがどれだけ手間をかけて考えるかを表す努力度（effort）を、claude.aiとCowork上でもユーザーが選べるようになった（全プランで利用可）。高く設定すれば深く考え、低く設定すれば速く応答する
ダイナミックワークフローズ（Dynamic workflows）： Claude Codeの新機能（リサーチプレビュー）。数十～数百のサブエージェント（メインのAIが仕事を分担させる小さなAI）を並列で走らせ、数十万行規模のコードベース移行などを1セッションで自律的に実行し、結果を検証してから返す。実例として、ランタイム「Bun」をZig言語からRust言語へ移植する作業（約75万行、初コミットからマージまで11日、既存テストの99.8％が通過）が公開されている
ウルトラコード（ultracode）： Claude Code内の設定。努力度を最高クラス（xhigh）に固定しつつ、ワークフローを使うかどうかをClaude自身に判断させるClaude Code固有設定
高速モード（fast mode）の大幅な値下げ： 出力速度が2.5倍になる高速モードが、従来比でおよそ3分の1の価格で使えるようになった
会話途中のsystemメッセージ対応： Messages APIで、ユーザーの発言の直後にsystemメッセージ（AIへの基本指示）を差し込めるようになった。長い会話の途中で指示を更新しても、それ以前のやりとりのプロンプトキャッシュ（入力を再利用してコストを下げる仕組み）を壊さずに済む
モデル仕様： APIモデルIDはclaude-opus-4-8。100万（1M）トークン（AIが文章を処理する最小単位）のコンテキストウィンドウ（一度に扱える文章量の上限。ただしMicrosoft Foundryでは20万）、12万8千（128K）の最大出力トークン、適応的思考（adaptive thinking：タスクの難易度に応じて考える深さを自動調整する仕組み）に対応する

APIまわりの更新点（移行時の注意）

4.7からはコード変更不要： Opus 4.8は、ツールやプラットフォーム機能がOpus 4.7と同一で、4.7で動いていたコードはそのまま動く。4.6から4.7への移行時のような破壊的変更はない
最小キャッシュ長の引き下げ： プロンプトキャッシュが効く最小プロンプト長が1024トークンに下がった（4.7より小さい）。4.7では短すぎてキャッシュできなかった入力も、変更なしでキャッシュ対象になる
拒否理由の明示： Claudeが要求を断ったとき、その拒否の種類を示すstop_detailsオブジェクトが正式にドキュメント化された
努力度（effort）のデフォルト： APIやClaude Codeを含む全環境で、努力度の既定値がhighになっている。コーディングなどではxhigh以上が推奨される