Check Point傘下のLakeraは、AIエージェントを標的とした最新の攻撃トレンドをまとめたレポートを発表した。システムプロンプトの抽出や間接的プロンプトインジェクションなど、攻撃手法が急速に変化している実態が浮き彫りとなっている。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
Check Point Software Technologies傘下でAI(人工知能)セキュリティプラットフォームを手掛けるLakeraは2025年12月25日、AIエージェントの安全性を分析した「2025年第4四半期エージェントセキュリティ動向レポート」(Q4 2025 Agent Security Trends Report)を発表した。
調査は、Lakeraの保護ツール「Lakera Guard」およびAI攻撃シミュレーション環境「Gandalf: Agent Breaker」内のインタラクション(やりとり)を対象に、2025年第4四半期(10〜12月)の特定の30日間に焦点を当てて分析されたものだ。AIエージェントの利用が広がることで、攻撃者が狙う侵入口に変化が見られる。
2025年は、実用的なAIエージェント機能が現れ始めた。AIモデルは文書の読み取りやツールの呼び出し、複数ステップにまたがるタスクの調整を自律的に実行できるようになった。
こうした進化に合わせ、攻撃者の行動も適応している。AIモデルが文書やツール、外部データと連携するようになると、脅威の対象領域はネットワークやアプリケーションにとどまらなくなった。
信頼できないWebページの読み取りや、構造化されたワークフローの実行が可能になり、攻撃者はAIシステムそのものに影響を及ぼすための新たな侵入経路を手にしたのだ。
これは単にAIエージェントが普及したという話ではない。新機能が登場するやいなや、攻撃者がその挙動を即座に試行できるほど、技術の進歩が高速化していることを示している。初期段階のブラウジングや検索、軽量なツール呼び出しでさえ、新たな脆弱(ぜいじゃく)性を生み出す要因となり得る。
攻撃意図の中で最も多く見られたのは、「システムプロンプトの抽出」だった。AIエージェントにおいてシステムプロンプトには、役割定義やツールの仕様、ワークフローのロジックなどが記述されている。これらはエージェントの振る舞いを決定付ける情報であり、攻撃者にとっては事実上の「設計図」に相当する。
システムプロンプトを把握できれば、エージェントの制約や判断条件、外部ツールとの連携方法を推測できるため、後続の攻撃を設計しやすくなる。このため、システムプロンプトの抽出は、AIエージェントを狙う攻撃において最初に試みられるケースが多い。
システムプロンプト抽出攻撃では、主に以下の2つの手法が確認されている。
第4四半期に2番目に多く観測されたのは、制限されているコンテンツを、有害に見えない形で生成させようとする試みだ。攻撃者はプロンプトの役割を「分析タスク」「変換」などと位置付け、AIモデルの解釈をずらそうとする。
AIモデルは、有害なコンテンツの生成を直接要求された場合は拒否する。これに対し「評価」や「ロールプレイ」といった文脈で要求された場合、同様の内容を再現してしまう可能性がある。
確認されたプロンプトのうち相当な割合を占めていたのが、AIモデルの挙動を探る探索的プローブだ。拒否パターンの研究や挙動の不整合の特定を目的としており、感情操作や矛盾した指示、突然の役割変更などを用いて試行が行われる。
こうしたプローブは偵察の役割を担い、ガードレールがどこで緩むかといった情報を把握するために使われる。エージェントが複雑なワークフローを担うにつれ、この探索フェーズの重要性が増している。
第4四半期には、AIモデルが外部入力を処理し、ステップ間で情報を伝達するようになったことで初めて成立する、AIエージェント特有の攻撃実例が確認された。主な攻撃パターンは以下の通り。
本四半期の分析で明らかになった重要な点の一つは、間接的な攻撃は直接的なプロンプトインジェクションに比べ、より少ない試行回数で成功するという事実だ。攻撃者はもはや単純なインジェクションに頼らず、文書やWebページに指示を埋め込む間接攻撃を好むようになっている。
有害な指示がユーザーの意図ではなく外部コンテンツを通じて届く場合、初期段階のフィルタリング効果は低下する。この傾向は、AIエージェントが検索システムや構造化データソースと深く統合されるにつれ、さらに拡大する可能性がある。
レポートは、2026年以降のAIセキュリティにおける教訓として以下の3点を挙げている。
2026年は、AIエージェントによる生成物だけでなく、ワークフロー全体にまでセキュリティを拡張することが重要な課題となる。
AIエージェントのミス、責任は誰に? 「業務を任せた上司・管理者」が3割超で最多
トークン破産、情報漏えい、LLM実行遅延――全部「AI Gateway」に任せよう 無料枠で学ぶAIエージェント開発、運用の新常識
AIエージェントは同僚ではない チームを壊す擬人化の罠Copyright © ITmedia, Inc. All Rights Reserved.