「AIエージェント基盤の構築は色々大変」 Claude Managed Agentsはどう進化しているのか楽天も採用

Anthropicがβ版で公開したAIエージェント実行基盤「Claude Managed Agents」。構築の課題が多い実行基盤をフルマネージド化し、さまざまな機能を追加し続けている。

» 2026年06月25日 11時00分 公開
[@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 Anthropicは2026年4月8日(米国時間、以下同)、AIエージェント実行基盤「Claude Managed Agents」をβ版で公開。4月23日には「メモリ」機能がβ版で、5月19日には、「アウトカム」「マルチエージェントオーケストレーション」をβ版で公開した。「ドリーミング」(リサーチプレビュー段階)も発表しており、これらの機能により、AIエージェントは人間による細かな指示なしで、複雑なタスクをより的確に処理できるという。

 5月19日には、「セルフホスト型サンドボックス」をβ版で公開し、「MCP(Model Context Protocol)トンネル」(リサーチプレビュー段階)を発表。6月9日には、「スケジュールデプロイ」、CLIなどのツールを認証するために環境変数を「Vault」(保管庫)に保存する機能もβ版で公開し、エージェントのセキュリティを向上させている。

 なお、これらの発表時には、幾つかの機能の採用企業として、楽天も名を連ねている。本稿では、Claude Managed Agentsと、最近追加された機能を紹介する。

Claude Managed Agentsとは何か

 2026年6月24日現在β版のClaude Managed Agentsは、Anthropicが管理するインフラ上で動作し、構成可能なエージェント実行基盤だ。

 同社の大規模言語モデル(LLM)「Claude」を自律型エージェントとして実行するためのハーネス(エージェントの挙動を制御/誘導するガードレールや検証の仕組み)とインフラを提供する。

Claude Managed Agentsのアーキテクチャ(提供:Anthropic

 開発者は、Claude Managed Agentsを使うことで、独自のエージェントループやツール実行レイヤー、ランタイムを構築することなく、Claudeにファイルの読み取り、Web閲覧、コマンドやコードの実行などを安全に行わせることができる。

 Claude Managed Agentsは、長時間にわたるタスクや非同期処理に適している。組み込みのプロンプトキャッシングや圧縮などのパフォーマンス最適化をサポートし、高品質で効率的なエージェント出力を可能にするという。

セッション間でコンテキストを引き継げるメモリ機能

 メモリ機能を使うことで、ユーザーの設定、プロジェクトの規約、過去のミス、ドメインコンテキストなどを「メモリストア」としてテキストファイルで保存できる。

 各Managed Agentsのセッションは、デフォルト(規定)で新しいコンテキストから開始され、セッションが終了すると、エージェントが構築した状態は全て失われるが、メモリ機能によってセッション間で引き継ぐことができる。

メモリストアの使用イメージ(提供:Anthropic

ドリーミング機能による自己改善型エージェントの構築

 ドリーミングは、エージェントのセッションとメモリストアを分析し、パターンを抽出してメモリを整理することで、エージェントが時間とともに改善されるようにする、スケジュールされたプロセスだ。

 開発者はこのメカニズムを制御でき、ドリーミングが自動的にメモリを更新するか、人間による確認を経た上で変更が反映されるようにするかを選択することが可能だ。

ドリーミングによるメモリの再構築によってエージェントの自己改善が進む(提供:Anthropic

 ドリーミングは、エージェントが単独では見逃してしまうパターンを表面化させる。その中には、繰り返し発生するミス、複数エージェントが収束するワークフロー、チーム内で共有される好みなどが含まれる。さらに、ドリーミングはメモリを再構築し、有用な状態を維持する。

 メモリとドリーミングを組み合わせることで、自己改善型エージェントのための堅牢(けんろう)なメモリシステムが形成される。メモリは、各エージェントが作業中に学んだ内容を蓄積し、ドリーミングはセッション間でそのメモリを精緻化し、それらの知見をエージェント間で共有させるとともに、常に最新の状態に保つ。

 ドリーミング機能の利用を希望する開発者は、AnthropicのWebサイトからアクセスをリクエストする必要がある。

より良い成果に向けて自己評価し、修正も行うアウトカム機能

 アウトカム機能により、開発者は「成功とは何か」を定義した評価基準を記述でき、エージェントはその達成に向けて行動する。エージェントは、この基準に基づいて自らの作業を確認し、出力が十分に改善されるまで自己修正もできる。

 独立した評価者が独自のコンテキストウィンドウで、この評価基準に照らしてエージェントの出力を評価する。出力が基準を満たさない場合、評価者は問題点を特定し、エージェントに修正を促す。

 アウトカム機能は、細部への注意と網羅性が求められるタスクで特に有効だ。さらに、ブランドガイドラインとの整合性など、定性的な品質評価にも対応する。

 アウトカムを定義してエージェントにタスクを実行させ、完了時にWebフックで通知を受けることも可能だ。

マルチエージェントオーケストレーション機能による複雑なタスクへの対応

 単一のエージェントでは処理し切れない作業量がある場合、マルチエージェントオーケストレーションにより、リードエージェントが仕事を分割し、それぞれを専門エージェントに委任できる。各専門エージェントは、独自のモデル、プロンプト、ツールを持つ。

 これらの専門エージェントは、共有ファイルシステム上で並列に作業し、リードエージェント全体のコンテキストに貢献する。イベントは永続的であり、各エージェントが自身の実行内容を記憶しているため、リードエージェントはワークフローの途中で他のエージェントの状況を確認できる。

「Claude Console」では、どのエージェントが何を、どのような順序で、なぜ実行したのかを追跡でき、タスクがどのように委任され、実行されたかを完全に可視化できる(提供:Anthropic

実行範囲を自社の境界内に限定する「セルフホスト型サンドボックス」機能

 セルフホスト型サンドボックスでは、機密ファイル、パッケージ、サービスを自社のインフラ内、またはマネージドサンドボックスプロバイダーのインフラ内に保持することができる。マネージドサンドボックスプロバイダーには、CloudflareやDaytona、Modal、Vercelなどがある。

セルフホスト型サンドボックス機能の概要(提供:Anthropic

プライベートネットワーク内のサービスに接続する「MCPトンネル」機能

 MCPトンネルを使うと、エージェントはユーザーのプライベートネットワーク内にあるMCPサーバにアクセスできようになる。ユーザー環境の内部にあるデータベース、プライベートAPI、ナレッジベース、チケットシステムなどをインターネットに公開する必要がなくなるという。

MCPトンネル機能の概要(提供:Anthropic

 MCPトンネル機能を利用するには、AnthropicのWebサイトからアクセスをリクエストする必要がある。

エージェントをスケジュールに基づいて実行させる「スケジュールデプロイ」機能

 エージェントにcronスケジュールが割り当てられ、定型的な作業を自動的に完了させることができる。ユーザーがスケジューラを構築したりホストしたりする必要はないという。

スケジュールデプロイの使用イメージ(提供:Anthropic

環境変数を「Vault」に保存する機能

 エージェントは、直接API呼び出しやCLI、MCPを介して外部システムに接続するが、環境変数をVaultに保存できるようになったことで、CLIなどのツールが認証済みリクエストを実行できる。

環境変数を「Vault」に保存する機能の概要(提供:Anthropic

Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ

スポンサーからのお知らせPR

注目のテーマ

その「AIコーディング」は本当に必要か?
Microsoft & Windows最前線2026
4AI by @IT - AIを作り、動かし、守り、生かす
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。