Anthropicの最上位モデル「Claude Opus」をリニューアルした。開発タスクでの実力を再び押し上げつつ、大幅な値下げも実施。今回のアップデートが“今のAI開発”に何をもたらすのか、一言コメントを添えて見ていく。
ここ数カ月、Claudeシリーズでは中位モデルのSonnet 4.5が、上位モデルであるOpus 4.1のコーディング性能を一時的に上回る状況が続いていた。その“逆転状態”が今回、Anthropic自身の手によって解消された。Anthropicは2025年11月24日(米国時間)、最上位のフラッグシップモデル「Claude Opus 4.5」を公開したためだ。
Opus 4.5は、特にプロ開発者向けに再強化された最新モデルであり、コーディング性能をシリーズ最上位へと押し上げた。長時間の処理や多段階の複雑なタスクでも安定して動作し、前世代から全体的に性能が底上げされている。
ソフトウェアエンジニアリング分野のベンチマーク(SWE-bench Verified)におけるコーディング性能比較(公式発表ページより引用)Opus 4.5の大きな進化は、単に回答精度が向上したことではなく、長時間タスクを破綻(はたん)させない基盤機能がさらに強化された点にある。特に、エフォート制御(effort control:思考量を調整する仕組み)、高度なツール利用、そして「コンテキスト圧縮」の考え方が取り入れられている点が象徴的だ。
なお、コンテキスト圧縮(context compaction)とは、AIが保持する作業メモリを自動的に整理し、重要な文脈だけを残して処理を継続するための仕組みである。長時間の作業ログや複数ステップにわたるタスクでも情報が膨張しにくく、途中で文脈が失われることを避けられるため、とりわけ大規模な開発作業との相性が良い。
この仕組みは、コーディングやデバッグだけでなく、Claudeアプリ内での表計算やスライド作成といった連続作業でも威力を発揮する。文脈を途切れさせずに処理を続けられるため、より実用的なエージェントとして振る舞えるようになったのである。
――ここからは『Deep Insider Brief』恒例の“ひと言コメント”として、今回の動きを手がかりに技術の“今”をもう少し深く眺めてみたい。
Deep Insider編集長の一色です。こんにちは。
Claude CodeのMAX/Proプランのユーザーに朗報です。9月末にSonnet4.5が登場して以降、最上位モデル「Opus」の存在感が薄れていましたが、今回のアップデートで“開発向けの最強モデル”が帰ってきましたね。
上に示した画像のベンチマークのように、コーディング性能は発表ベースで世界1位です。実際の人間の使用感を反映しやすいと考えられるベンチマークLMArenaのWebDev(Web開発)リーダーボードでも、執筆時点(2025年11月27日時点)でGemini 3 Proを再び抜いて1位になっています。開発タスクに対する学習量が他モデルよりも明らかに厚く、その積み上げが実戦性能にも直結している印象です。
とはいえ、順位は月単位どころか最近は日単位でも入れ替わるため、ランクの数値だけを追い続けることに大きな意味はないのかもしれません。さらに、用途やプロジェクトによって“相性の良いモデル”は変わる(と筆者は考えている)ため、結局のところ、自分の手で試してみて「どれが最適か」という感触を各チームや各人、各プロジェクトで確かめるのが一番だと感じています。
なお、GitHub Copilotの有償プラン(Pro/Pro+/Business/Enterpriseなど)でも、既に最新の「Claude Opus 4.5」が利用可能になっています。私も試してみましたが、応答速度・内容ともに非常に良好でした。Claude Codeについてはまだ十分に触れていないのですが、これから本格的に使い始める予定なので、今後はその使用感も継続的にお伝えできればと思います。
開発者は、Anthropic公式APIやClaude Code、GitHub Copilotだけでなく、Amazon BedrockやGoogle CloudのVertex AIなどでも、既にClaude Opus 4.5を利用できるようになっている。
今回の発表で特に注目したいのが、最上位モデルであるにもかかわらず価格が大きく引き下げられた点である。以前のOpus 4.1は入力15ドル/出力75ドル(100万トークン当たり)という高額な価格設定だったが、Opus 4.5では入力5ドル/出力25ドルと、なんと3分の1までコストダウンしている。詳しい内容は本稿の最後に記載する。
さらに、今回のリリースには開発者が押さえておきたい特徴が他にも幾つか含まれている。これらを丁寧に解説すると長くなるため、残りは以下に箇条書きで整理しておく。
※価格は変更される可能性があるため、利用の際はAnthropic公式ドキュメント「Pricing」を必ず確認してほしい。
なお、プロンプトキャッシュ利用時(20万トークン以上)を多用するワークロードでは、入力・キャッシュ書き込み・読み出しの単価差によって、タスクによってはSonnet 4.5よりもOpus 4.5の方が総コストを抑えられるケースもあり得る。詳しくは「Pricing」の内容をよく確認してほしい。
Copyright© Digital Advantage Corp. All Rights Reserved.