「ブラウザ自動化」の限界を解消? Googleが新標準「WebMCP」早期プレビュー公開AIエージェントがWebサイトを直接操作するための2つのAPIを提案

Googleは、AIエージェントがWebサイトと構造化された方法でやりとりするための新しいWeb標準「WebMCP」の早期プレビュー版を公開した。Web開発者がAIエージェント向けにツールを公開することで、AIエージェントがより高速かつ正確に処理を実行できるようになるという。

» 2026年03月18日 13時00分 公開
[@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 Googleは2026年2月10日(米国時間)、AI(人工知能)エージェントがWebサイトとやりとりする方法を標準化する「WebMCP」の早期プレビュー版を公開した。

 WebMCPは、Webアプリケーションが構造化されたツールを公開するための標準的な方法を提供する仕組みだ。これにより、AIエージェントがWebサイトとやりとりする方法と場所をWebサイト側が指定できるようになる。

 フライトの予約、サポートチケットの送信、複雑なデータのナビゲーションなどが具体的なユースケースとして挙げられている。これにより曖昧さが解消され、より高速かつ安定した自律処理(ワークフロー)が実現するとしている。

WebMCPが提案する2つの新API――従来の「ブラウザ操作自動化」とは何が違う?

 WebMCPは、ブラウザエージェントがユーザーに代わってアクションを実行できるようにする2つの新しいAPIを提案している。

  1. 宣言型API:HTMLフォームで直接定義できる標準アクションを実行する
  2. 命令型API:JavaScriptの実行を必要とする、より複雑で動的なインタラクションを実行する

 これらのAPIは、Webサイトを「エージェント対応」にし、生のDOM(Document Object Model)の操作よりも信頼性とパフォーマンスの高いエージェントワークフローを実現するという。

 「従来のエージェントによるUI(ユーザーインタフェース)操作では、クリックやキー入力をシミュレートする必要があった。WebMCPでは、構造化されたJavaScriptツールをエージェントが直接呼び出すことにより、信頼性と速度を向上させることができる」(Google)

設計目標と対象外領域

 WebMCPのGitHubリポジトリによると、WebMCPには明確な設計目標と対象外領域が定められている。

 設計目標としては以下の4つが掲げられている。

  • 人間参加型(Human-in-the-loop)ワークフローの実現
    • ユーザーがAIエージェントにタスクを委任しつつ、可視性と制御を維持するシナリオをサポートする
  • AIエージェント統合の簡素化
    • エージェントがUI操作ではなく、明確に定義されたJavaScriptツールを通じて信頼性の高いやりとりを実現する
  • 開発者負担の最小化
    • 既存ページのJavaScriptコードを再利用してツールを作成できるようにする
  • アクセシビリティーの向上
    • 支援技術がWebアプリケーションの機能に標準化された方法でアクセスできるようにする

 一方、対象外領域として以下が明示されている。

  • 人間の観察を伴わないヘッドレスブラウジング(GUI〈グラフィカルユーザーインタフェース〉によらないブラウザ操作)のシナリオ
  • 完全自律型のエージェントワークフロー
    • 完全自律型のシナリオにはA2A(Agent2Agent)プロトコルがより適切とされている
  • バックエンド統合(MCPなど)の代替
  • 人間向けインタフェースの代替
  • エージェントによるWebサイトの発見可能性(ディスカバラビリティー)向上

MCPとの関係性

 WebMCPを使用するWebサイトは、クライアントサイドスクリプトでツールを実装するMCP(Model Context Protocol)サーバと考えることができるという。MCPはAnthropicが開発したプロトコルで、「Claude Desktop」やOpenAIの「Agents SDK」でサポートされている。

 WebMCPはMCPの置き換えではなく、共存するものとして位置付けられている。MCPがバックエンドでのエージェントとサービスの直接的なやりとりを担うのに対し、WebMCPはアプリケーションが制御するUI上で、アプリケーション、エージェント、ユーザーの三者がコンテキスト(文脈)を共有しながら動作する点が異なる。

セキュリティ上の注意点

 WebMCPは、セキュリティに関して以下のような点に注意する必要があるという。

  • モデルポイズニング
    • 悪意あるツール定義によりAIモデルの動作が汚染されるリスク
  • クロスオリジン分離
    • 異なるオリジン間でのツール呼び出しに関するセキュリティ境界の確保
  • パーミッション管理
    • ツールの実行に対する適切な権限管理の仕組み

想定されるユースケース

 想定されるユースケースは以下の通り。

  • カスタマーサポート:エージェントが必要な技術的詳細を自動的に入力し、ユーザーが詳細なサポートチケットを作成できるようにする
  • eコマース:エージェントがユーザーの探しているものを見つけ、ショッピングオプションを設定し、購入手続きフローを正確にナビゲートできるようにする
  • 旅行:エージェントが構造化データを使用して検索、結果のフィルター、予約の処理を行い、ユーザーが希望するフライトをより簡単に見つけられるようにする

Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ

スポンサーからのお知らせPR

注目のテーマ

Microsoft & Windows最前線2026
人に頼れない今こそ、本音で語るセキュリティ「モダナイズ」
4AI by @IT - AIを作り、動かし、守り、生かす
AI for エンジニアリング
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。