OpenAI、AIエージェント構築ツール「Responses API」「Agents SDK」を発表 どう役立つのか、事例も紹介:エージェントの柔軟性、拡張性を向上させるAPIとSDK
OpenAIは、AIエージェント開発の新しいツール「Responses API」と「Agents SDK」を発表した。
OpenAIは2025年3月11日(米国時間)、新しいAIエージェント開発ツール「Responses API」「Agents SDK」を発表した。同社は以下のように説明している。
Responses APIで複雑なタスクをより柔軟に処理可能に
Responses APIは、OpenAIの組み込みツールを活用してエージェントを構築するための新しいAPIプリミティブ(基本要素)だ。これは、対話形式のAIを扱うAPI「Chat Completions API」のシンプルさと、「Assistants API」のツール利用機能を組み合わせたものだ。モデルの能力が進化し続けるにつれて、Responses APIは、エージェントアプリケーションを構築する開発者にとって、より柔軟な基盤を提供すると当社は考えている。Responses APIを呼び出すことで、開発者は複数のツールを組み合わせたり、モデルと複数回のやり取りを行ったりし、ますます複雑なタスクを解決できるようになる。
Responses APIは、Web検索、ファイル検索、コンピュータ操作などを行う新しい組み込みツールをサポートする。これらのツールは連携して動作するよう設計されており、モデルを現実世界に接続し、タスクの遂行をより効果的にする。また、統一されたアイテムベースの設計、よりシンプルなポリモーフィズム、直感的なストリーミングイベント、「response.output_text」のようなモデルのテキスト出力を簡単に取得できるSDKヘルパーなど、複数の使いやすさの向上をもたらしている。
Responses APIは、複数のAPIや外部ベンダーを統合する複雑さを伴うことなく、OpenAIのモデルと組み込みツールをアプリケーションへ手軽に組み合わせたい開発者に向けて設計されている。このAPIにより、OpenAI上にデータを保存することが容易になり、開発者はトレーシングや評価などの機能を使用してエージェントのパフォーマンスを確認、分析できる。
なお、データがOpenAIに保存されている場合でも、OpenAIのモデルはデフォルトでビジネスデータを学習対象とはしていない。Responses APIは全ての開発者が利用できる。
Agents SDKでエージェント開発と管理が容易に
エージェントを構築するには、コアロジックを実装し、さまざまなツールへのアクセスを可能にして実用性を高めるだけでなく、開発者がエージェント型ワークフローをオーケストレーションする必要がある。新しいオープンソースのSDK「Agents SDK」は、マルチエージェントワークフローのオーケストレーションを簡素化し、2024年にリリースした実験的なSDK「Swar」と比べて大幅に改善されている。Swarmは開発者コミュニティーに広く採用され、複数の顧客によって成功裏に導入された実績がある。
主な改善点
- Agents:明確な指示と組み込みツールを備えた簡単に設定可能なLLM
- Handoffs:エージェント間でインテリジェントに制御を移行
- Guardrails:入出力の検証を行う設定可能なセーフティチェック
- Tracing&Observability:エージェントの実行トレースを可視化し、デバッグやパフォーマンス最適化を支援
Agents SDKは、カスタマーサポートの自動化、複数ステップのリサーチ、コンテンツ生成、コードレビュー、見込み客の開拓など、さまざまな実務用途を持ったアプリケーションに適している。例えば、CoinbaseはAgents SDKを活用し、「AgentKit」のプロトタイピングと導入を迅速に適用した。AgentKitは、AIエージェントが暗号資産ウォレットやさまざまなオンチェーン活動とシームレスに連携できるツールキットだ。Coinbaseは、数時間でカスタム統合を完了し、開発者が複雑なエージェント設定をすることなく、統合作業に集中できる環境を実現した。
Boxは、Web検索機能とAgents SDKを活用し、企業がBox内やインターネットソースに保存された非構造化データを検索、クエリ、洞察を抽出できるエージェントを、数日で開発した。このアプローチにより、顧客は最新情報にアクセスできるだけでなく、社内の権限とセキュリティポリシーに従った安全でセキュアな方法で、社内の機密データを検索できるようになる。例えば、金融サービス企業がBox AIエージェントを呼び出すカスタムエージェントを構築し、Boxに保存されている内部市場分析と、Web上のリアルタイムなニュースや経済データを統合することで、アナリストに投資判断のための包括的な情報を提供することができる。
Agents SDKは、Responses APIやChat Completions APIと連携して動作する。また、Chat CompletionsスタイルのAPIエンドポイントを提供する他のプロバイダーのモデルにも対応している。開発者はPythonコードベースにすぐに統合できる。Node.jsのサポートも近日中に追加を予定している。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
OpenAI、音声エージェントを強化する新しい3つのモデルをAPIで提供開始 Whisperとは何が違う?
OpenAIは、新しい音声認識モデル「gpt-4o-transcribe」と「gpt-4o-mini-transcribe」および音声合成モデル「gpt-4o-mini-tts」のAPIを提供開始した。JetBrainsがOpenAI、Google、Anthropicの11モデルをベンチマーク比較 速度や知能別で優れたモデルを紹介
JetBrainsは、「JetBrains AI Assistant」がマルチモデルに対応し、開発者がタスクに応じて最適な大規模言語モデルを選択できるようになったことを受け、OpenAI、Google、Anthropicの主要モデルのベンチマーク比較結果を公式ブログで紹介した。OpenAI、最新モデル「GPT-4.5」のリサーチプレビューを公開 ハルシネーションはどれだけ少なくなる?
OpenAIは、これまでで最も大規模かつ高性能なチャット向けモデル「GPT-4.5」のリサーチプレビューを公開した。「ChatGPT Pro」プランのユーザーと開発者が利用できる。