Microsoft Researchは、AIエージェントの実行軌跡から障害箇所を自動で特定するフレームワーク「AgentRx」をオープンソースソフトウェアで公開した。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
Microsoft Researchは2026年3月12日(米国時間)、AIエージェントの障害を体系的に診断するフレームワーク「AgentRx」(Agent Diagnosisの略)をオープンソースソフトウェア(OSS)で公開した。
AgentRxは、クラウド障害管理やAPIワークフローなど複雑なタスクを実行するAIエージェントが失敗した場合に、「どのステップで問題が発生したか」を自動で特定することを目的としている。
AIエージェントのデバッグは、従来のソフトウェアと比べて難易度が高い。主な要因としてAIエージェントの以下の特性が挙げられる。
こうした特性から、従来のようにタスク完了の成否を問う指標だけでは、障害の根本原因を特定するには不十分だったという。
AgentRxの評価には、手動でアノテーションを付与した115件の失敗軌跡からなるベンチマーク「AgentRx Benchmark」(Hugging Faceで公開)を使用した。
以下の9カテゴリーで障害を分類している。この分類体系は、開発者が「計画の順守失敗」(エージェントが自身の手順を無視した場合)と「新情報の捏造(ねつぞう)」(ハルシネーション)を区別するのに役立つという。
ベンチマークのデータは、以下の3ドメインから収集されている。
既存のLLMベースのプロンプト手法と比較した検証では、障害箇所の特定精度が23.6ポイント、根本原因の特定精度が22.9ポイント向上したという。
AgentRxは、エージェントの実行軌跡を検証するパイプラインとして設計されている。具体的には以下の4段階で処理を行う。
異なるドメインのログを共通の中間表現に変換する。
ツールのスキーマやドメインポリシー(例:「ユーザー確認なしにデータを削除してはならない」)に基づき、実行可能な制約を自動生成する。
各制約を適用条件が成立するステップのみで検証し、違反の証拠付きログを生成する。
生成した違反ログと9カテゴリーの障害分類を用いて、LLMが「重大障害ステップ」(回復不能なエラー)を特定する。
AgentRxのフレームワークとデータセットはOSSで公開されている。
GitHubが明かす、「マルチエージェントシステム」失敗の要因と設計のプラクティス
AIエージェントは「便利なだけ」では普及しない? 標準化へ、イニシアチブ発足
開発者の未来は「承認疲弊」? AIエージェントが従来のガバナンスを破壊する理由
AIエージェントの「振る舞い」をどう評価する? 実践者が明かす「設計」「テスト」の勘所
Cursor開発チームが明かす、コーディングエージェントの7つのベストプラクティスCopyright © ITmedia, Inc. All Rights Reserved.