検索
ニュース

Windowsの脆弱性探索に100超のAIエージェント活用 Microsoftの月例パッチの裏で稼働するシステムとは「AIによる脆弱性発見の優位性はモデルにあるのではない」 Microsoft見解

Microsoftはマルチモデルエージェント型セキュリティシステム「MDASH」の取り組みについて解説した。Microsoftのセキュリティエンジニアリングチームが活用しており、Windowsの未知の重大な脆弱性発見に貢献しているという。

Share
Tweet
LINE
Hatena

 Microsoftは2026年5月12日(米国時間、以下同)に公式ブログで、新しいマルチモデルエージェント型セキュリティシステム「MDASH」(コードネーム)を発表した。AIを活用したサイバー防御における大きな前進だとしている。

 MDASHは、Microsoftのセキュリティエンジニアリングチームによって使用されており、限定プライベートプレビューの一環として少数の顧客によってテストされている。既に「Windows」のネットワーキングおよび認証スタックの16件の脆弱(ぜいじゃく)性の発見に貢献し、これらの中には、「Critical」(重大)レベルに分類される4件のリモートコード実行(RCE)の脆弱性が含まれている。

 MDASHは、Microsoft Security Multi-moDel Agentic Scanning Harness(マルチモデルエージェント型スキャンハーネス)の略称。MicrosoftのAutonomous Code Security(ACS:自律的コードセキュリティ)チームが構築した、エージェント型の脆弱性発見・修正システムだ。ハーネスは、エージェントの挙動を制御/誘導するガードレールや検証の仕組みを含む、エージェントの実行環境を指す。

 単一モデルアプローチとは異なり、MDASHは、フロンティアモデルと蒸留モデルから成るアンサンブル(集合体)全体で、100を超える専門AIエージェントを調整、統括する。これらのエージェントが連携し、悪用可能なバグの発見、検証、実証をエンドツーエンドで実行する。

 MDASHの根底にある考え方は、「モデルは入力の一つにすぎない。システムこそが製品である」というものだ。

「AIを活用したサイバー防御」の最前線 Windowsの未知の脆弱性をAIが発見

 MDASHは以下のように、幾つかの評価環境で成果を示している。

  • いかなるモデルにも学習されていない非公開のテスト用ドライバ「StorageDrive」をスキャンし、意図的に仕込まれた21件の脆弱性全てを発見し、誤検出はゼロだった
  • Microsoft Security Response Center(MSRC)が過去5年間に2つのWindowsコンポーネント(「clfs.sys」と「tcpip.sys」)をレビューし、確認したバグの実例と、これらのコンポーネントのパッチ適用前のスナップショットをMDASHがスキャンした結果を比較したところ、以下の結果となった
    • clfs.sys:MDASHは、MSRCが確認した28件のバグの96%を再発見した
    • tcpip.sys:MDASHは、MSRCが確認した7件のバグを100%再発見した
  • 世界の1507件の脆弱性で構成される公開ベンチマーク「CyberGym」において、業界トップの88.45%の検出成功率を記録。リーダーボードで首位を獲得し、2位のAnthropicの「Claude Mythos Preview」のスコア(83.1%)を約5ポイント上回った
  • 2026年5月12日にMicrosoftが公開した月例セキュリティパッチにおいて、WindowsカーネルのTCP/IPスタックおよびIKEv2サービスに関する「Critical」(重大)レベルの脆弱性を含む16件の脆弱性の修正に貢献した
CyberGymベンチマーク結果のリーダーボードで首位に立つMDASH(提供:Microsoft)
CyberGymベンチマーク結果のリーダーボードで首位に立つMDASH(提供:Microsoft)
モデルのリリース時期とCyberGymベンチマークでの検出成功率(提供:Microsoft)
モデルのリリース時期とCyberGymベンチマークでの検出成功率(提供:Microsoft)

MDASHの仕組み

 MDASHは、コードベースを入力として受け取り、検証済みかつ実証済みの発見結果を出力するパイプラインとして構成されている。パイプラインは以下の5段階から成る。

1. 準備

 対象のソースコードを取り込み、言語認識インデックスを構築し、過去のコミットを分析することで、アタックサーフェス(攻撃対象領域)と脅威モデルを描き出す。

2. スキャン

 候補となるコードパスで専門特化型の監査エージェントを実行し、発見結果の候補(仮説と根拠を伴う)を出力する。

3. 検証

 各発見結果の到達可能性と悪用可能性について、賛成と反対の両側から議論する第2グループのエージェント(ディベーター)を実行する。

4. 重複排除

 意味的に同等な発見結果を一つにまとめる。

5. 実証

 脆弱性の存在を動的に証明するため、トリガーとなる入力を構築および実行する。

MDASHの自動コードセキュリティワークフロー:リポジトリ分析、コードスキャン、バグのトリアージ、概念実証の生成、自動パッチ作成、検証の各段階を示す(提供:Microsoft)
MDASHの自動コードセキュリティワークフロー:リポジトリ分析、コードスキャン、バグのトリアージ、概念実証の生成、自動パッチ作成、検証の各段階を示す(提供:Microsoft)

MDASHを支える3つの特徴

 以下の3つのアーキテクチャ上の特徴が、MDASHの機能を支えている。

MDASHのハーネスによって管理される多様なモデルのアンサンブル

 高度な推論を担うSOTA(state-of-the-art)モデル、大量処理向けにコスト効率の良いディベーターとして機能する蒸留モデル、独立した反対意見を提示する別のSOTAモデルを組み合わせている。モデル間の意見の不一致自体がシグナルとして扱われる。監査モデルが何らかの事項について、疑わしいとしてフラグを立て、ディベーターがそれに反論できない場合、その発見結果の信頼性が高まる。

専門エージェント

 パイプラインの各段階は固有の役割、プロンプト体系、ツール、停止基準を持ち、監査エージェント、ディベーターエージェント、実証エージェントは、それぞれ異なる方法で推論する。システムは、単一のエージェントがあらゆるタスクを処理することを想定していない。MDASHには100以上の専門エージェントが含まれており、これらは、CVE(Common Vulnerabilities and Exposures:共通脆弱性識別子)が割り当てられた過去の脆弱性とそのパッチに関する深い研究を通じて構築されている。

拡張可能なプラグインを使用できるエンドツーエンドのパイプライン

 ドメインエキスパートはプラグインにより、基盤モデルが単独では認識できないコンテキスト(カーネルの呼び出し規約、IRPルール、ロックの不変条件、IPC信頼境界など)をパイプラインに注入できる。

AIによるサイバー防御が重要な3つの理由

 Microsoftは、MDASHの戦略的な意義は明確だと述べている。AIによる脆弱性の発見は、研究段階から、エンタープライズ規模での実運用レベルの防御手段へと移行しており、エンジニアリング上の具体的な課題となりつつある。

 AIによる脆弱性発見の持続的な優位性の源泉は、単一のAIモデル自体にあるのではなく、複数のモデルを基に、ハーネスが作業を管理するエージェント型システムにあるとしている。評価環境で目覚ましい実績を示しているMDASHは、こうしたAIによる脆弱性の発見がスケール可能な証拠だという。

 Microsoftは、MDASHのようなマルチモデルエージェント型脆弱性発見・修正システムが重要な理由を3つ挙げている。

 1つ目は、脆弱性の発見には、単一のプロンプトでは達成できない構成が必要なためだ。カーネルの競合状態や、複数ファイルにまたがるエイリアスチェーンといった複雑なバグは、ファイル横断のパターン比較、複数ステップの到達可能性分析、専門エージェント間の議論、エンドツーエンドの実証構築を順序立てて実行できるシステムでなければ、可視化できない。

 2つ目は、検証こそが「発見」と「修正」を分けるためだ。バグの候補を単に提示するだけのスキャナーは、トリアージのバックログを生み出すにとどまるが、MDASHは発見結果を議論し、重複排除を経て、実証した上で報告する。それはエージェントとプラグインから成るパイプラインのエンジニアリングの成果によるものだ。

 3つ目は、システムがモデルの改良を吸収し、持続性を発揮するためだ。パイプラインの各段階(ターゲット設定、議論、重複排除、実証)は、特定のモデルに依存していないため、新しいモデルが登場しても、これらを書き直す必要はない。顧客によるプロジェクト固有のコンテキスト、スキャンプラグイン、実証エージェントへの投資は、全て引き継がれる。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る