脆弱性公開から攻撃コードが出回るまでには、これまで一定の時間的猶予があった。しかしMythosを使った最新の検証によって、その前提が崩れつつある。わずか1時間でエクスプロイトが生成される状況で、防御をどう見直すべきか。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
Anthropicは2026年6月8日(米国時間)、公開済み脆弱(ぜいじゃく)性(N-day)に関する大規模言語モデル(LLM)の影響を検証した結果を公表した。
同社は先端AIモデルが短時間で自律的に脆弱性悪用コードを開発できる水準に到達したと報告し、修正プログラム適用までの猶予期間が縮小しているとの見解を示した。
N-dayは既に公表済みで修正プログラムも提供済みの脆弱性を指す。ただし利用者側で更新が済んでいない機器が残るため、攻撃者は更新されるまでの期間を狙ってこれを悪用する。修正版と旧版の差分解析によって脆弱性の内容を推定できることから、攻撃手法の開発は時間の問題となる場合が多い。
従来、差分解析と悪用コードの作成には高度な解析技術が必要だった。同調査では2017年に登場したランサムウェア「WannaCry」が、「Windows」のセキュリティパッチ「MS17-010」公開から59日後に発生した事例や、2023年に登場したCitrix製品の脆弱性「CVE-2023-4966」(通称、Citrix Bleed)の公開攻撃コードが約2週間後に現れた事例を紹介している。Mandiantの2020年の分析でも、25件中16件は悪用まで1カ月以上を要した。
Anthropicは、こうした工程がAIによってどの程度短縮されるかを調査した。評価対象には「Mozilla Firefox」(以下、Firefox)とWindowsの脆弱性修正を使っている。
Firefoxにおいては、2026年2〜3月公開版に含まれるJavaScriptエンジン「SpiderMonkey」の18件の脆弱性修正を検証した。モデルには公開差分や修正版前後のビルドを与えたが、非公開の不具合報告情報は提供しなかった。
その結果、まず脆弱性を再現するPoC(概念実証)コードの生成能力を確認した。「Claude Mythos Preview」は18件中14件で動作するPoCを作成した。最初のPoCは約12分で完成し、14件のうち13件は40分以内に生成された。
続いて悪用コード生成能力を評価した。評価基準は、JavaScriptサンドボックス外に置いた秘密情報の取得に成功し、修正版では成功しないこととした。Claude Mythos Previewは1時間未満で最初の悪用コードを完成させ、最終的に8件の動作するコード実行型攻撃を生成した。「Opus 4.8」は2件、「Opus 4.6」と「Sonnet 4.6」は各1件だった。
Windowsでは2026年1〜2月のカーネル脆弱性21件を対象とした。対象は全て権限昇格の不具合で、モデルには修正版前後のバイナリや逆コンパイル結果、差分情報、Microsoftの公開アドバイザリーのみを与えた。
PoC生成評価において、Claude Mythos Previewが21件中18件で脆弱性到達に成功した。最初のPoC生成には31分を要し、これら成功した18件のPoCは全て6時間以内に生成された。
権限昇格攻撃の評価において、同モデルが8種類の攻撃連鎖を完成させた。低権限利用者からSYSTEM権限獲得まで到達した攻撃を構築したと報告している。総コストはAPI利用料換算で約1万5700ドル、1件当たり約2000ドルだった。
評価対象21件のうち14件はMicrosoftが「悪用可能性が低い」または「悪用の見込みが低い」と分類していた。しかしClaude Mythos Previewは14件中13件でPoCを生成し、そのうち1件では権限昇格攻撃も成立した。Anthropicは、こうした評価基準が人間の研究者を前提としている点に言及した。
Windows Autopatchの配布実績を参照した場合、登録端末の90%に修正が配信されるまで約7日、強制再起動までは11日かかる。検証結果ではAIが全8件の攻撃連鎖を完成させる時間はこれを大きく下回った。
Anthropicは「月次更新や段階的配布を前提とした従来の修正運用が変化に直面している」と指摘する。産業制御システムや医療機器、IoT機器など更新が難しい環境は特に影響を受ける可能性があると分析している。
同社は対策として、Mozillaによる更新頻度短縮の取り組みを紹介した他、Rustなどメモリ安全性を備えた言語への移行や、Windowsのセキュリティ機能「Control Flow Guard」やハードウェアシャドースタックなどの防御機構導入に言及した。AI自体を活用した脆弱性対策についても研究を継続中としている。
パスキー神話崩壊 Google Password Managerの同期機能を狙う新攻撃手法
イラン vs. 米国・イスラエル 現実味を増す“サイバー報復”の連鎖【動画あり】
「EDR無効化」「暗号化はしない」 2026年のランサムウェアに起きた変化
5週間で340超の企業が被害に Microsoft 365のアクセスを奪う新型フィッシングに注意
ITコストが爆増する“低品質キッティング”の特徴 あるべき姿を考えるCopyright © ITmedia, Inc. All Rights Reserved.