Claude Opus 4.5登場 プロ開発者向けにコーディング性能を再強化、API価格は1/3にDeep Insider Brief ― 技術の“今”にひと言コメント

Anthropicの最上位モデル「Claude Opus」をリニューアルした。開発タスクでの実力を再び押し上げつつ、大幅な値下げも実施。今回のアップデートが“今のAI開発”に何をもたらすのか、一言コメントを添えて見ていく。

» 2025年12月02日 05時00分 公開
[Deep Insider]
「Deep Insider Brief ― 技術の“今”にひと言コメント」のインデックス

連載目次

 ここ数カ月、Claudeシリーズでは中位モデルのSonnet 4.5が、上位モデルであるOpus 4.1のコーディング性能を一時的に上回る状況が続いていた。その“逆転状態”が今回、Anthropic自身の手によって解消された。Anthropicは2025年11月24日(米国時間)、最上位のフラッグシップモデル「Claude Opus 4.5」を公開したためだ。

 Opus 4.5は、特にプロ開発者向けに再強化された最新モデルであり、コーディング性能をシリーズ最上位へと押し上げた。長時間の処理や多段階の複雑なタスクでも安定して動作し、前世代から全体的に性能が底上げされている。

ソフトウェアエンジニアリング分野のベンチマーク(SWE-bench Verified)におけるコーディング性能比較(公式発表ページより引用) ソフトウェアエンジニアリング分野のベンチマーク(SWE-bench Verified)におけるコーディング性能比較(公式発表ページより引用)
横軸は主要AIモデル(例:Claude Opus 4.5、Sonnet 4.5、Opus 4.1、Gemini 3 Pro、GPT-5.1など)を示し、縦軸は「課題を正しく解決できた割合(%)」を表している。上に行くほどコード生成や修正タスクの精度が高いことを意味する。色付きのバーはClaudeシリーズ(Opus/Sonnet)を示しており、Opus 4.5は80.9%と高い精度を記録した。シリーズ内ではSonnet 4.5(77.2%)や前世代の上位モデルOpus 4.1(74.5%)を上回り、提示されている比較範囲においてGemini 3 Pro(76.2%)やGPT-5.1(76.3%)よりも高いスコアとなっている。

 Opus 4.5の大きな進化は、単に回答精度が向上したことではなく、長時間タスクを破綻(はたん)させない基盤機能がさらに強化された点にある。特に、エフォート制御(effort control:思考量を調整する仕組み)、高度なツール利用、そして「コンテキスト圧縮」の考え方が取り入れられている点が象徴的だ。

 なお、コンテキスト圧縮context compaction)とは、AIが保持する作業メモリを自動的に整理し、重要な文脈だけを残して処理を継続するための仕組みである。長時間の作業ログや複数ステップにわたるタスクでも情報が膨張しにくく、途中で文脈が失われることを避けられるため、とりわけ大規模な開発作業との相性が良い。

 この仕組みは、コーディングやデバッグだけでなく、Claudeアプリ内での表計算やスライド作成といった連続作業でも威力を発揮する。文脈を途切れさせずに処理を続けられるため、より実用的なエージェントとして振る舞えるようになったのである。

――ここからは『Deep Insider Brief』恒例の“ひと言コメント”として、今回の動きを手がかりに技術の“今”をもう少し深く眺めてみたい。


一色政彦

 Deep Insider編集長の一色です。こんにちは。

 Claude CodeのMAX/Proプランのユーザーに朗報です。9月末にSonnet4.5が登場して以降、最上位モデル「Opus」の存在感が薄れていましたが、今回のアップデートで“開発向けの最強モデル”が帰ってきましたね。

 上に示した画像のベンチマークのように、コーディング性能は発表ベースで世界1位です。実際の人間の使用感を反映しやすいと考えられるベンチマークLMArenaのWebDev(Web開発)リーダーボードでも、執筆時点(2025年11月27日時点)でGemini 3 Proを再び抜いて1位になっています。開発タスクに対する学習量が他モデルよりも明らかに厚く、その積み上げが実戦性能にも直結している印象です。

 とはいえ、順位は月単位どころか最近は日単位でも入れ替わるため、ランクの数値だけを追い続けることに大きな意味はないのかもしれません。さらに、用途やプロジェクトによって“相性の良いモデル”は変わる(と筆者は考えている)ため、結局のところ、自分の手で試してみて「どれが最適か」という感触を各チームや各人、各プロジェクトで確かめるのが一番だと感じています。

 なお、GitHub Copilotの有償プラン(Pro/Pro+/Business/Enterpriseなど)でも、既に最新の「Claude Opus 4.5」が利用可能になっています。私も試してみましたが、応答速度・内容ともに非常に良好でした。Claude Codeについてはまだ十分に触れていないのですが、これから本格的に使い始める予定なので、今後はその使用感も継続的にお伝えできればと思います。


 開発者は、Anthropic公式APIやClaude Code、GitHub Copilotだけでなく、Amazon BedrockやGoogle CloudのVertex AIなどでも、既にClaude Opus 4.5を利用できるようになっている。

 今回の発表で特に注目したいのが、最上位モデルであるにもかかわらず価格が大きく引き下げられた点である。以前のOpus 4.1は入力15ドル/出力75ドル(100万トークン当たり)という高額な価格設定だったが、Opus 4.5では入力5ドル/出力25ドルと、なんと3分の1までコストダウンしている。詳しい内容は本稿の最後に記載する。

 さらに、今回のリリースには開発者が押さえておきたい特徴が他にも幾つか含まれている。これらを丁寧に解説すると長くなるため、残りは以下に箇条書きで整理しておく。

その他の特徴

モデル性能や機能の向上

  • トークン効率の向上: Opus 4.5は、前世代よりも少ないトークンで同等以上の成果を出せるよう最適化されている。これにより、実利用時のコスト削減や応答速度の改善が期待できる
  • 自律的なエージェント動作: 複数ステップを要するタスクやあいまいな目標に対して、AI自身が判断しながら処理を進められるようになった。試行錯誤を含む“流れのある作業”に強くなっている点が特徴
  • デスクトップ操作とツール利用: コンピュータ使用(Computer Use)機能がさらに拡張され、スプレッドシート編集やスライド作成、ファイル操作などの外部ツール連携が強化された。アプリの操作やオフィス系タスクでも、より実用的なエージェントとして動作できる

Anthropic Claude APIの価格表(Opus 4.5利用時)

  • 100万トークン当たりの料金:
    • 入力トークン:5.00ドル
    • 出力トークン:25.00ドル
  • プロンプトキャッシュ利用時の料金(100万トークン当たり):
    • 書き込み:6.25ドル
    • 読み出し:0.50ドル
    • プロンプトキャッシュとは、一度処理したプロンプト(指示文)を保存しておく仕組み。キャッシュから読み出す際は再計算が不要なため、低コストで利用できる

 価格は変更される可能性があるため、利用の際はAnthropic公式ドキュメント「Pricing」を必ず確認してほしい。

 なお、プロンプトキャッシュ利用時(20万トークン以上)を多用するワークロードでは、入力・キャッシュ書き込み・読み出しの単価差によって、タスクによってはSonnet 4.5よりもOpus 4.5の方が総コストを抑えられるケースもあり得る。詳しくは「Pricing」の内容をよく確認してほしい。

「Deep Insider Brief ― 技術の“今”にひと言コメント」のインデックス

Deep Insider Brief ― 技術の“今”にひと言コメント

Copyright© Digital Advantage Corp. All Rights Reserved.

アイティメディアからのお知らせ

スポンサーからのお知らせPR

注目のテーマ

人に頼れない今こそ、本音で語るセキュリティ「モダナイズ」
4AI by @IT - AIを作り、動かし、守り、生かす
Microsoft & Windows最前線2025
AI for エンジニアリング
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。