Anthropicの最新モデルは、長時間の開発作業でも安定して動作する処理能力と、利用者が安心して使える安全設計の両面で進化。開発者向けに多くの新機能も追加された。
Anthropicは2025年9月30日、同社の主力AIモデル「Claude」シリーズの最新版「Claude Sonnet 4.5」を公開した。“世界最高のコーディングモデル”(the best coding model in the world)と豪語するほどの自信を見せており、実際に前世代を上回る精度を達成している。
実用面でも、複雑な多段階タスクにおいて30時間以上にわたり一貫した処理を維持できたことが確認されている。言い換えれば、非常に長い依存関係を壊さずに作業を継続できる安定性を備えており、大規模なコードベースでも粘り強く開発を進められることが期待される。
さらに注目すべきは、安全性の強化である。Sonnet 4.5はこれまでで最も“人間の意図や倫理観に沿うよう調整された”(aligned)モデルとして設計されており、性能だけでなく信頼性の面でも大きな進化を遂げた。
具体的には、欺瞞(ぎまん)、おべっか(過剰な従順)、支配を強めるような動き、妄想の助長、有害な指示プロンプトへの従属といった、人にとって望ましくない振る舞い(Misaligned behavior)を自動的に検出し評価するテスト(※Anthropic独自の評価フレームワークによる)において、主要モデルの中で最も低いスコア(=問題行動が少ない)を記録した。また、安全対策(セーフガード)も強化されており、特に大量破壊兵器(化学兵器、生物兵器、放射能兵器、核《CBRN》兵器)に関連する潜在的に危険な入出力を検出するフィルターが設けられている。
もちろん、進化はこれだけにとどまらない。汎用(はんよう)モデルとしての思考力(reasoning)や数学的推論力が大幅に強化され、チャット形式での質問応答や複雑な問題解決タスクにも一層強くなっている。さらに、金融・法律・医療・STEM(科学・技術・工学・数学)といった専門分野での知識と論理展開力も向上し、「エージェント構築」や「コンピュータ操作」を含む多様な知的活動を支える“総合モデル”としての可能性を、いっそう押し広げている。
Deep Insider編集長の一色です。こんにちは。
Claudeシリーズはもともと、開発者に人気の高いAIモデルです。特に2025年2月登場の「Claude 3.7 Sonnet」で優れたプログラミング能力を示し、同年4月発表のMaxプランでは、通常の利用頻度であれば“ほぼ無制限”に使える環境(※実際には制限あり)が支持を集めました。
とはいえ夏以降は、「性能劣化のうわさ」や「使用制限の強化(週単位での使用制限の導入)」などもあり、人気がやや低迷し始めていました。そうした流れを払拭するかのように登場したのが、今回の「Claude Sonnet 4.5」です。
長時間タスクの安定性などによってユーザー評価が改善し、「Maxプランはやめない」という声も多く挙がっています。一方で、依然として評価が分かれる面もあり、AIモデル間の性能差が小さくなる中で、プログラミング分野でのモデル競争がさらに激化しそうですね。
さて、今回のリリースには、先に述べた性能強化以外にも、開発者向けの新機能や製品アップデートが多数含まれていた。これらを丁寧に解説すると長くなるので、残りは以下に箇条書きでまとめておく。
価格は従来のSonnet 4と同じで、100万トークン当たり入力3ドル、出力15ドル。以下の詳細は公式ドキュメントに基づく(後述の「Pricing」参照)。
※価格については変更される可能性があるため、利用の際はAnthropic公式ドキュメント「Pricing」を必ず確認してほしい。
Copyright© Digital Advantage Corp. All Rights Reserved.