「ブラウザ自動化」の限界を解消? Googleが新標準「WebMCP」早期プレビュー公開:AIエージェントがWebサイトを直接操作するための2つのAPIを提案
Googleは、AIエージェントがWebサイトと構造化された方法でやりとりするための新しいWeb標準「WebMCP」の早期プレビュー版を公開した。Web開発者がAIエージェント向けにツールを公開することで、AIエージェントがより高速かつ正確に処理を実行できるようになるという。
Googleは2026年2月10日(米国時間)、AI(人工知能)エージェントがWebサイトとやりとりする方法を標準化する「WebMCP」の早期プレビュー版を公開した。
WebMCPは、Webアプリケーションが構造化されたツールを公開するための標準的な方法を提供する仕組みだ。これにより、AIエージェントがWebサイトとやりとりする方法と場所をWebサイト側が指定できるようになる。
フライトの予約、サポートチケットの送信、複雑なデータのナビゲーションなどが具体的なユースケースとして挙げられている。これにより曖昧さが解消され、より高速かつ安定した自律処理(ワークフロー)が実現するとしている。
WebMCPが提案する2つの新API――従来の「ブラウザ操作自動化」とは何が違う?
WebMCPは、ブラウザエージェントがユーザーに代わってアクションを実行できるようにする2つの新しいAPIを提案している。
- 宣言型API:HTMLフォームで直接定義できる標準アクションを実行する
- 命令型API:JavaScriptの実行を必要とする、より複雑で動的なインタラクションを実行する
これらのAPIは、Webサイトを「エージェント対応」にし、生のDOM(Document Object Model)の操作よりも信頼性とパフォーマンスの高いエージェントワークフローを実現するという。
「従来のエージェントによるUI(ユーザーインタフェース)操作では、クリックやキー入力をシミュレートする必要があった。WebMCPでは、構造化されたJavaScriptツールをエージェントが直接呼び出すことにより、信頼性と速度を向上させることができる」(Google)
設計目標と対象外領域
WebMCPのGitHubリポジトリによると、WebMCPには明確な設計目標と対象外領域が定められている。
設計目標としては以下の4つが掲げられている。
- 人間参加型(Human-in-the-loop)ワークフローの実現
- ユーザーがAIエージェントにタスクを委任しつつ、可視性と制御を維持するシナリオをサポートする
- AIエージェント統合の簡素化
- エージェントがUI操作ではなく、明確に定義されたJavaScriptツールを通じて信頼性の高いやりとりを実現する
- 開発者負担の最小化
- 既存ページのJavaScriptコードを再利用してツールを作成できるようにする
- アクセシビリティーの向上
- 支援技術がWebアプリケーションの機能に標準化された方法でアクセスできるようにする
一方、対象外領域として以下が明示されている。
- 人間の観察を伴わないヘッドレスブラウジング(GUI〈グラフィカルユーザーインタフェース〉によらないブラウザ操作)のシナリオ
- 完全自律型のエージェントワークフロー
- 完全自律型のシナリオにはA2A(Agent2Agent)プロトコルがより適切とされている
- バックエンド統合(MCPなど)の代替
- 人間向けインタフェースの代替
- エージェントによるWebサイトの発見可能性(ディスカバラビリティー)向上
MCPとの関係性
WebMCPを使用するWebサイトは、クライアントサイドスクリプトでツールを実装するMCP(Model Context Protocol)サーバと考えることができるという。MCPはAnthropicが開発したプロトコルで、「Claude Desktop」やOpenAIの「Agents SDK」でサポートされている。
WebMCPはMCPの置き換えではなく、共存するものとして位置付けられている。MCPがバックエンドでのエージェントとサービスの直接的なやりとりを担うのに対し、WebMCPはアプリケーションが制御するUI上で、アプリケーション、エージェント、ユーザーの三者がコンテキスト(文脈)を共有しながら動作する点が異なる。
セキュリティ上の注意点
WebMCPは、セキュリティに関して以下のような点に注意する必要があるという。
- モデルポイズニング
- 悪意あるツール定義によりAIモデルの動作が汚染されるリスク
- クロスオリジン分離
- 異なるオリジン間でのツール呼び出しに関するセキュリティ境界の確保
- パーミッション管理
- ツールの実行に対する適切な権限管理の仕組み
想定されるユースケース
想定されるユースケースは以下の通り。
- カスタマーサポート:エージェントが必要な技術的詳細を自動的に入力し、ユーザーが詳細なサポートチケットを作成できるようにする
- eコマース:エージェントがユーザーの探しているものを見つけ、ショッピングオプションを設定し、購入手続きフローを正確にナビゲートできるようにする
- 旅行:エージェントが構造化データを使用して検索、結果のフィルター、予約の処理を行い、ユーザーが希望するフライトをより簡単に見つけられるようにする
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
Open WebUIと自作MCPツールで「ローカル操作を“安全に”自動化する」方法
気軽に試せるラップトップ環境で、チャットbotを提供するオールインワンの生成AI環境構築から始め、Kubernetesを活用した本格的なGPUクラスタの構築やモデルのファインチューニングまで解説する本連載。今回は、MCPサーバを自作し、日々の作業を効率化、自動化するアプローチを解説します。
「MCPを補完」 オープンなAIエージェント連携プロトコルをGoogle Cloudが発表
Google Cloudが、複数のAIエージェントを連携させる標準プロトコルを発表した。オープンソースとして、コミュニティーやパートナーと開発を進めていくという。AnthropicのMCPとは補完関係にあると強調している。
MCPは死んでない? MCPの2026年ロードマップ公開 「AIツール接続」から「AI自律連携インフラ」へ
AIと外部ツールをつなぐ規格「MCP(Model Context Protocol)」の2026年ロードマップは、MCPの役割が「単なるツール接続の仕組み」から「AI同士が連携する基盤」へと広がりつつあることを示している。そのポイントを整理し、「MCP vs. CLI」論争についても触れる。