Claude Opus 4.7は、一般公開モデルとしては最強クラスの性能を示した一方で、実際のユーザー評価は大きく割れている。本稿では、Anthropicの公式情報に加え、初期ユーザーの反応も踏まえながら、その強さと「怖さ」を整理する。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
Anthropicは少し前、極めて高いサイバー能力を持つ新モデルClaude Mythos Previewを限定的に公開した。重要ソフトウェアの防御に役立つ一方で、攻撃側に回った場合のリスクも大きいため、まずは“Project Glasswing”のような限られた枠組みの中で使う、というのが同社の判断だった。そこから約1週間後の2026年4月16日(米国時間)、それより性能は抑えつつも、広く使える最上位モデルとして出てきたのがClaude Opus 4.7である。
このOpus 4.7は、性能を評価するベンチマークだけを見ると、現在の一般公開モデルの中でも最強クラスに入る。コーディング、長時間タスク、文書理解、画像理解まで、実務に効く部分を広く押し上げてきたからだ。単に会話がうまいだけではなく、長い作業を途中で崩さずに進めたり、複数の資料や画面情報をまとめて扱ったりする力まで含めて、一段上に来た印象がある。
主要ベンチマークにおけるClaude Opus 4.7と他モデルの比較(公式発表ページから引用)この表でまず押さえたいのは、Opus 4.7が前世代のOpus 4.6を多くの項目で上回り、一般公開モデルとして最上位級の水準にあるという点である。例えば、高度なコード修正能力を測る「SWE-bench Pro」では64.3%を記録し、GPT-5.4の57.7%を上回っている。しかも、単に一部の評価だけが突出しているのではなく、コーディングや検索、コンピュータ操作、金融分析、推論といった複数の領域で底上げが起きている。
その中でも目を引くのが、長時間タスクでの粘り強さである。Anthropicが公表ページ内の別の図で示した「Vending-Bench 2」では、Opus 4.6の8018ドルに対し、Opus 4.7は10937ドルの残高を維持した。これは、複数の手順が続く作業でも途中で方針を崩しにくく、目的を見失わずに進める力が強まったことを示す結果として読むことができる。
もっとも、今回のOpus 4.7が多くの人、特にソフトウェアエンジニアに強い衝撃を与えているのは、この「圧倒的な性能」だけではない。この1週間ほど、XなどのSNSに寄せられたユーザーの反応を見ると、自律性の高さや完走力を評価する声がある一方で、実務投入をためらわせるような不安や、セキュリティ面での怖さを指摘する声も目立つ。強いのは確かだが、その強さがそのまま安心感につながっていないのである。
――ここからは『Deep Insider Brief』恒例の“ひと言コメント”として、今回の動きを手掛かりに技術の“今”をもう少し深く眺めてみたい。さらに後半では、Opus 4.7で何が変わったのかも整理する。
Deep Insider編集長の一色です。こんにちは。
Opus 4.7はまだ本格的には試せていないのですが、登場直後からXでユーザー報告を追っていたところ、批判の多さに驚きました。これほど批判が集中するのは、Claude系モデルでは今までなかったことです。しかも事例の内容を知ると恐怖を覚えるほどで、少し手を出しづらくなってしまいました……。
どんなユーザー報告が来ていたかというと、例えば以下のような事例です。
ユーザーコミュニティーではよく、GPTモデル/Codexは“指示に忠実なガリ勉タイプ”で、Claudeモデル/Claude Codeは“人間らしく雰囲気で意図をくんでくれるバイブコーディングタイプ”と表現されています。ちなみに私は前者が好みですが、多くの人は後者が好みのようです。ところがOpus 4.7は、“指示に忠実なガリ勉タイプ”に近づいたという印象を持つ人が多いようです。
ガリ勉とバイブコーディングという2つの性格が同居した結果、「指示されたタスクや目標を達成するためなら、手段を選ばない」という“かなり危うい性格”を発揮し始めました。その結果、事例に挙げたようなことが起きているのではないかと私は見ています。目的のためなら安全チェックさえ自ら回避しようとするのは、さすがに問題だと思います。事例のユーザーも、「そんなこと言ってないよ!」と慌てて実行を止めたそうです。
しかもOpus 4.7は、トークン消費が前モデル比で最大1.35倍に増える可能性があります(トークナイザの変更による公式仕様)。さらに最近は、「Anthropicがユーザーの使用量(使えるトークンの量)を静かに絞っているのではないか」という疑惑を持つ人までいます。GitHub Copilotなどでの利用コストも前モデル比で約2倍以上になっています。「コスパが明らかに悪化した」「4.6に戻した」という声も少なくありません。
まさに“最強で最恐”なモデル、Claude Opus 4.7。性能の高さは間違いない一方で、現時点では不安の方が先に立ちます。私は、もう少し様子を見たいと思っています。
Claude Opus 4.7は、Anthropic公式APIの他、GitHub Copilot、Cursor、Amazon Bedrock、OpenRouterなどで利用できる。以下、公式ドキュメントを基に、今回のアップデートで特に注目したい変更点を整理していこう。
現時点では、基本単価は前バージョン(Opus 4.6)と同水準となっている。なお、以前はあった20万(200K)超トークンに対する割増料金は2026年3月13日以降、廃止されている。
※価格は変更される可能性があるため、利用の際はAnthropic公式ドキュメント「Pricing」を必ず確認してほしい。
Copyright© Digital Advantage Corp. All Rights Reserved.