Claude Mythosはパンドラの箱か　最新AIモデルが引き起こす別次元のセキュリティ懸念

Anthropicの最新AIモデル「Claude Mythos Preview」がセキュリティ上の大きな議論を巻き起こしている。同社はこのモデルを当面リリースせず、Glasswingというコンソーシアムを立ち上げ、要件を満たした企業・組織に対してのみ提供することを明らかにした。Mythosをめぐる一連の経緯についてまとめた。

[三木泉，＠IT] PC用表示関連情報

LINE

Hatena

AnthropicのアモデイCEO（Glasswing紹介ビデオより）

　Anthropicが開発した最新AIモデル「Claude Mythos Preview」（ギリシャ神話からきた名称のせいか、日本では「ミソス」ではなく「ミトス」と発音する人が多い）が大きな議論を巻き起こしている。同社はこのモデルをセキュリティ上の危険性のためとして当面リリースしない。2026年4月7日（米国時間）の発表直後にIT他社や金融機関とセキュリティ保護を目的とした「Glasswing」というプロジェクトを立ち上げ、要件を満たした企業・組織に対してのみ提供することを明らかにした。問題は、従来のモデルとは別次元のサイバーセキュリティ能力がもたらす脅威にある。本稿では、Mythosをめぐる一連の経緯についてまとめた。

　「（AIモデル開発では）加速する指数関数的な進展がある。その指数曲線の上には重要な転換点が存在する。Claude Mythos Previewは、この転換点における特に大きな飛躍だ。私たちは Mythosをサイバースキルに特化して訓練したわけではなく、コードに強くなるよう訓練した。しかし副次的な効果として、サイバーにも強いものになった」。Anthropicのダリオ・アモディCEOは、Glasswingプロジェクト紹介ビデオでこのように語っている。

　Mythosは主要なベンチマーク全てで既存の同社フラッグシップモデル「Claude Opus 4.6」を大きく上回る結果を出している。他社モデルと比較しても劣る項目はほぼない。サイバーセキュリティベンチマーク「CyberGym」のスコアは、Opus 4.6が0.67なのに対し、Mythosは0.83だ。「最も熟練した専門家を除く、ほぼ全ての人間を上回るレベル」とされる。

　こうしたベンチマークでは分かりにくいMythosのサイバーセキュリティ能力を示す例として、報道などでよく取り上げられているのがゼロデイ脆弱（ぜいじゃく）性の発見／攻撃性能だ。

　Anthropicは、MythosがさまざまなOSやブラウザの脆弱性を1000件以上発見したと主張している。これには重大なものが多数含まれているという。堅固なセキュリティで知られるOpenBSDについては27年ぶりに脆弱性を発見し、マシンをネットワーク経由でクラッシュさせることに成功した。また、Firefox 147を対象とした検証で、Mythosは181回にわたって実際に動作するエクスプロイトの開発に成功した。2回にとどまったOpus 4.6と比較して、エクスプロイト開発能力が90倍向上したことを示しているという（新バージョンでパッチ済み）。

　さらに懸念される点がある。

　過去バージョンを使ったある実験で、Mythosにサンドボックスコンテナを与え、そこから脱出して通知するようにと指示した。Mythosはセーフガードを回避することに成功し、研究者にメッセージを送ってきた。さらに問題だったのは、指示しなかったことまで実行したことだ。

　「モデルはまず、限られた数の事前に定められたサービスにしかアクセスできないはずのシステムから、広範なインターネットアクセスを獲得するため、ある程度高度な多段階エクスプロイトを開発した。その後、指示通り研究者に通知した。さらに懸念すべきことに、自らの成功を示そうとする未指示の行動として、エクスプロイトの詳細を、見つけにくいが技術的には公開状態にある複数のWebサイトに投稿した」（Mythosのシステムカードより）

　Mythosは、少なくともセキュリティ体制の弱い比較的小規模な企業ネットワークに対して、エンド・ツー・エンドで自律的なサイバー攻撃を実行できる能力を持つとAnthropicは述べている。しかも指示以外の行動をとる可能性がある。

Project Glasswingとは

　Anthropicは、MythosのようなAIモデルが今後続々と登場するとし、敵対勢力に悪用される前に重要なシステムの保護体制を確立することを目的として、Glasswingを始めたと説明する。このプロジェクトにはAnthropicの他、Amazon（Amazon Web Services）、Apple、Broadcom、Cisco、CrowdStrike、Google（Google Cloud）、JPMorganChase、Linux Foundation、Microsoft（Microsoft Azure）、NVIDIA、Palo Alto Networksの計12社が参加。Mythosをデプロイし、セキュリティ保護の目的に限定して使う。

　パートナーはこれを自社のセキュリティワークフローに組み込み、自社やオープンソースのコードセキュリティを強化する。

　他には厳しい要件を満たした40社程度が参加するとされる。AWS、Microsoft Azure、Google Cloudは、それぞれのWebサイトでMythosサービスについての告知を行っている。

Claude Mythosはパンドラの箱か 最新AIモデルが引き起こす別次元のセキュリティ懸念

Project Glasswingとは

Security & Trust 記事ランキング

Claude Mythosはパンドラの箱か　最新AIモデルが引き起こす別次元のセキュリティ懸念