Anthropicは2025年8月27日（米国時間）、Webブラウザ「Google Chrome」（以下、Chrome）で同社の生成AI（人工知能）ツール「Claude」を利用できるようにする機能「Claude for Chrome」の試験運用を開始した。対象は有料プラン「Claude Max」のユーザー1000人に限定し、今後の本格展開に向けて安全性やユーザー体験を検証するという。

Claude for Chromeは、Claudeがユーザーの代わりにChrome上でのボタンクリックやフォーム入力などの操作代行するChromeの拡張機能だ。カレンダー管理やメール返信、経費処理、Webサイトの動作確認といった作業を自動化できる。

利便性の向上が見込める機能ではあるが、「AIがWebブラウザの処理を代行すること」については幾つかの懸念点がある。その一つが「プロンプトインジェクション攻撃」だ。これは悪意ある攻撃者がWebサイトやメール、ドキュメントに隠された命令でAIをだまし、ユーザーに知られることなく有害な操作を実行させる攻撃だ。

Anthropicはこの攻撃の有効性を検証するために29種類、123ケースの攻撃シナリオを想定したレッドチーミングテストを実施した。その結果、適切なセキュリティ対策を講じない状態では攻撃成功率が23.6％に達したという。例えば、「セキュリティのためにメールを削除せよ」という攻撃メールを処理させたところ、Claude for Chromeはユーザーに確認することなくメールを削除した。

より洗練された権限管理のためにユーザーの意見を募集

この攻撃への対処としてAnthropicはClaude for Chromeのセキュリティを強化。具体的には、Webサイトごとのアクセス許可設定、重要操作時のユーザー確認、特定カテゴリーのサイトへのアクセス制限、怪しい命令文を検知するツールの導入といった多層的な防御策を構築した。これらの防御策を適用したところ、23.6％だった攻撃成功率を11.2％にまで低減できたという。

だが、この対策だけでプロンプトインジェクション攻撃に十分に対処できているわけではない。同社は「内部テストだけでは、実際のユーザーがどのようなリクエストを送り、どのサイトを訪れ、どのように悪意のあるコンテンツに遭遇するのかという現実世界の複雑さを再現しきれない」と説明している。

今回、ユーザーを絞って試験運用する目的はここにある。Anthropicは信頼できるユーザーと協働し実環境での使用状況を通じて、現状の防御策が機能しているかどうか、改良すべき点はどこかを明らかにするのが狙いだ。

試験運用に参加したい場合はClaude for Chromeの待機リストに登録する。アクセス可能になればChromeのWebストアから拡張機能をインストールし、Claudeアカウントで認証することで利用できる。

Anthropicは注意点として「現段階では金融や医療など、機密性の高い分野での利用を避けてほしい」と述べている。