検索
ニュース

Claude APIの新機能「アドバイザーツール」の使用方法AIエージェントの推論力を底上げしつつコスト最適化

AnthropicはClaude APIの新機能「アドバイザーツール」のβ版の提供を開始したと発表した。安価なモデルを実行役とし、複雑な判断のみを最上位モデル「Opus」に委譲する仕組みで、高い推論能力を保ちつつエージェント開発のコスト削減を支援するという。

Share
Tweet
LINE
Hatena

 Anthropicは2026年4月9日(米国時間)、Claude APIの新機能「アドバイザーツール」のβ版の提供を開始した。推論性能に応じて「Haiku」「Sonnet」「Opus」の3つの異なるモデルを展開する中、SonnetやHaikuを実行役(エグゼキューター)として動かしながら、必要な場面に限り最上位モデルのOpusに助言を求める仕組みだ。同機能は、API呼び出しを1行変更するだけで利用できるという。

アドバイザーツールの仕組み

 アドバイザーツールでは、SonnetやHaikuがエグゼキューターとして、ツールを呼び出し、結果を読み、解決に向けてタスクをエンドツーエンドで実行する。エグゼキューターが自力で解決できない判断に直面すると、アドバイザーであるOpusに助言を求める。

 Opusは共有コンテキストにアクセスし、計画、修正、停止シグナルのいずれかを返し、エグゼキューターが処理を再開する。アドバイザーはツールの呼び出しやユーザー向け出力の生成をせず、エグゼキューターへの助言のみを提供する。

エグゼキューターが主導し、必要時のみOpusに助言を求めるアドバイザーツール(提供:Anthropic)
エグゼキューターが主導し、必要時のみOpusに助言を求めるアドバイザーツール(提供:Anthropic)

 この構造は、大型のオーケストレーションモデルが作業を分解して小型のワーカーモデルに委譲する従来のサブエージェントパターンを反転させたものだ。アドバイザーツールは、より小型でコスト効率の高いモデルが処理を主導し、必要に応じて推論性能の高いモデルにエスカレーションするため、タスク分解やオーケストレーションロジックは不要となる。フロンティアレベルの推論は、エグゼキューターが必要とする場面でのみ適用され、それ以外はエグゼキューターのコスト水準で処理される。

「アドバイザーツール」の評価

 Anthropicの社内評価によると、Sonnet単体に対してOpusをアドバイザーとした構成は、ベンチマーク「SWE-bench Multilingual」で2.7ポイントのスコア向上を示し、エージェントタスク当たりのコストは11.9%削減されたとしている。

SWE-bench Multilingualでのスコアとタスク当たりコストの比較(提供:Anthropic)
SWE-bench Multilingualでのスコアとタスク当たりコストの比較(提供:Anthropic)

 上記の構成は、「BrowseComp」と「Terminal-Bench 2.0」のベンチマークでも、Sonnet単体よりタスク当たりコストを抑えつつスコアが向上したという。

 Haikuをエグゼキューターにした場合も効果があった。BrowseCompでは、Haikuに対してOpusをアドバイザーとした構成が41.2%のスコアを記録し、Haiku単体の19.7%から2倍以上に伸びた。Sonnet単体と比較するとスコアは29%下回るものの、タスク当たりのコストは85%低く、知能とコストのバランスが必要な大量処理に適しているという。

アドバイザーツールの利用手順

 Anthropicはアドバイザーツールの利用方法を次のように解説している。

  1. β版機能ヘッダ「anthropic-beta: advisor-tool-2026-03-01」を追加
  2. Messages APIリクエストに「advisor_20260301」を追加
  3. 使用状況に応じてシステムプロンプトを変更

 追加のラウンドトリップやコンテキスト管理は不要だ。エグゼキューターモデルが呼び出しタイミングを判断し、呼び出された際には整理されたコンテキストをアドバイザーモデルにルーティングし、計画を返してエグゼキューターが同じリクエスト内で処理を続行する。

料金とコスト管理

 アドバイザートークンはアドバイザーモデル(Opus)のレートで、エグゼキュータートークンはエグゼキューターモデル(SonnetやHaiku)のレートで課金される。アドバイザーは通常400〜700トークン程度の短い計画のみを生成し、エグゼキューターが低レートで全出力を担うため、全体コストはアドバイザーモデルを単独で使うよりも大幅に抑えられるという。

 「max_uses」でリクエスト当たりのアドバイザー呼び出し回数を制限でき、アドバイザートークンはusageブロックで分けて報告される。既存のツールとも連携可能だ。アドバイザーツールはMessages APIリクエストの1項目に過ぎないため、Web検索やコード実行時に、Opusへ助言を求めるプロセスを同じループ内で実行できる。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る