AIエージェントのトークン消費を約47%削減 Cursorの「コンテキストエンジニアリング」事例:応答品質を向上させる5つの取り組みとは
Anysphereは、コーディングエージェントの性能向上と効率化を実現する「動的コンテキスト探索」の取り組み事例を解説した。トークン消費の抑制やコーディングエージェントの応答品質向上に寄与しているという。
AI(人工知能)コードエディタ「Cursor」を開発するAnysphereは2026年1月6日(米国時間)、コーディングエージェントのコンテキスト管理を最適化する「動的コンテキスト探索」(dynamic context discovery)の取り組み事例を公式ブログで解説した。
ソフトウェア開発においてコーディングエージェントの実用化が進んでいる。だが、開発現場ではコンテキストウィンドウの枯渇による精度低下や、トークンコストの増大が課題となっている。
Anysphereはモデル自体の性能向上だけでなく、エージェントに入力する情報を適切に制御する「コンテキストエンジニアリング」の改善は、コーディングエージェントの提供者が解決すべき課題だと捉えているという。
そこで、プロンプトに必要な情報を全て詰め込む従来の「静的コンテキスト」(static context)のアプローチに対し、同社はエージェントが必要な情報を必要な時だけファイルシステムから自力で引き出す動的コンテキスト探索のアプローチを採用。不要な情報の読み込みを防ぎ、エージェントの「記憶力」やコスト効率を向上させたとしている。
AIエージェントのトークン消費を約47%削減 必要な情報を抜き出す5つの工夫
Anysphereによると、Cursorでは、動的コンテキスト探索を以下の5つの方法で実現しているという。
「tail」コマンドを用いてJSONの肥大化を防ぐ
ツール呼び出しが大きなJSON形式のレスポンスを返す場合、コンテキストウィンドウが急激に増大する課題がある。
そこでCursorは、サードパーティーツール(シェルコマンドやMCP〈Model Context Protocol〉)の出力をそのままプロンプトに流し込まず、一度ファイルに書き出す実装を採用した。
エージェントは「tail」コマンドを使ってファイルの末尾だけを確認し、必要に応じて読み進める。これにより、情報を切り捨てることなく、不要なトークン消費を回避しているという。
要約プロセスにおいてチャット履歴を参照する
コンテキストウィンドウがいっぱいになると要約ステップが実行される。だが、情報の圧縮によりエージェントのパフォーマンスが低下する可能性がある。これを防ぐため、Cursorは要約時にチャット履歴全体をファイルとして保持する手法を導入した。
エージェントは、要約から欠落した情報が必要だと判断した場合、この履歴ファイルを参照して詳細を復元できるという。
「Agent Skills」への対応
Cursorは、コーディングエージェントに特定のタスクの実行手順を指示する「Agent Skills」をサポートしている。Agent Skillsについても、全てを常時読み込むのではなく、ファイルとして定義して動的に扱っているという。エージェントは「grep」やセマンティック検索を用いて、タスクに関連するSkillだけを探索し、コンテキストに取り込む。
MCPツールのフォルダ同期でトークンを約47%削減
多数のツールを持つMCPサーバを接続すると、ツール定義だけでコンテキストウィンドウを圧迫してしまう。
そこでCursorは、ツールの説明文をフォルダ構造と同期させ、必要なツールだけをその都度検索・参照する方式を構築した。この戦略によるABテストでは、MCPツール使用時の総トークン数を46.9%削減できたという。
ターミナルログのファイル化とgrep検索
統合ターミナルの出力もローカルファイルシステムと自動同期される仕組みを採用した。これにより、エージェントは過去の実行結果やエラーログを、ファイルとして扱うことができる。
長いログに対しても、エージェントは「grep」コマンドなどのツールを用いて関連する行だけを検索、抽出できるため、サーバログのような長時間のプロセス解析も効率化できているという。
Anysphereは「LLM(大規模言語モデル)アプリケーションのインタフェースとして何が最適解になるかは確定していない」とした上で、「現状において『ファイル』はシンプルかつ強力な基本要素として機能している。複雑な抽象化レイヤーを重ねるよりも、ファイルベースのアプローチこそが、進化の速いエージェント開発において安全で確実な選択肢だ」との見解を示している。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
GPT-5.2-Codexが主要ツールで解禁 「Windows最適化」×「長時間エージェント」で実用性が向上
OpenAIのコーディング特化モデル「GPT-5.2-Codex」が、GitHub CopilotやCursorなど主要AI開発ツールで解禁された。長時間エージェントとWindows最適化の強化点を整理し、どんな開発者に効くアップデートなのかを解説する。
MCPサーバの機能と実装の肝――仕組みと構築の流れをSpring AIで理解する
Java×Spring AIで始めるAIプログラミングの入門連載。前回はLLMを通じて外部ツールの実行が可能なTool Callingとその外部実行ツール自体を独立させて実装が可能なMCPという仕組みの流れについて説明しました。今回は、MCPサーバ自体の機能とSpring AIでMCPサーバを実装する流れについて解説します。
Claudeの「Agent Skills」がMCPと同様、オープン標準に どんな便利スキルがある?
Anthropicは、「Claude」の「Agent Skills」機能をアップデートし、オープン標準として公開した。

