視覚的設計からチャット統合、性能評価まで一気通貫で支援する「AgentKit」を公開　OpenAI：OpenAIが提供するAIエージェント構築ツール

OpenAIは、AIエージェント開発を支援する包括的なツールセット「AgentKit」を発表した。複数エージェントの設計やチャットUI埋め込みを簡単にし、性能評価や強化学習で高品質なAI開発を実現するとしている。

» 2025年10月10日 08時00分公開

[＠IT]

この記事は会員限定です。会員登録（無料）すると全てご覧いただけます。

　OpenAIは2025年10月6日（米国時間）、開発者や企業がAI（人工知能）エージェントを構築、デプロイ（展開）、最適化するための包括的なツールセット「AgentKit」を発表した。OpenAIが2025年3月にリリースした「Responses API」を基盤として、開発者がより効率的に、信頼性の高い方法でAIエージェントを構築できるように支援するという。

リリース

ドラッグ＆ドロップで複雑なAIエージェントのワークフローを可視化

　従来、AIエージェント開発には多くの個別ツールや手動の作業が必要だったとOpenAIは指摘。「AgentKitのビルディングブロック（機能群）を利用することで開発者はワークフローを視覚的に設計し、AIエージェントUI（ユーザーインタフェース）をより迅速にアプリケーションやWebサイトに埋め込めるようになる」と説明している。

　AgentKitの特徴的なビルディングブロックは以下の通り。

Agent Builder

　マルチエージェントワークフローの作成とバージョン管理が可能な視覚的なインタフェース（視覚的キャンバス）。

Connector Registry

　複数のワークスペースや組織間でデータを管理、維持できる統合画面（管理パネル）。

ChatKit

　カスタマイズ可能な会話型AIチャットのUIを製品に埋め込むためのツールキット。

Evals

　プロンプトのテストやモデル動作の測定を支援するプラットフォーム。エージェントのパフォーマンスを測定、改善するための新機能が追加された。

Agent Builderでワークフローを設計

　AIエージェントワークフローは複雑化しており、開発者はその動作を明確に可視化する必要がある。Agent Builderは、視覚的キャンパス上で、ノードをドラッグ＆ドロップで配置し、つなげることでAIエージェントの処理の流れを構築できる。プレビュー実行、インライン評価設定、バージョン管理もサポートする。

Agent Builderでは、空白の視覚的キャンバスか事前構築済みテンプレートから作業を開始できる。この視覚的キャンバスでは、顧客サービス自動化フローの例が表示されている（提供：OpenAI）

　Agent Builderで使える「Guardrails」は、AIエージェントを意図しない動作や悪意ある挙動から守るためのオープンソースフレームワークだ。PII（個人を特定できる情報）のマスキングやフラグ設定、ジェイルブレーク（脱獄）の検出などの機能を持っており、信頼性と安全性を兼ね備えたAIエージェントの構築、デプロイを支援する。単体で使うこともできる上、「Python」および「JavaScript」のライブラリとして組み込むことも可能だ。

Connector Registryでデータやツールの接続を管理

　Connector Registryを使うことで、企業は複数のワークスペースや組織間でデータを管理、維持できる。単一の管理パネルに管理機能を統合し、「Dropbox」「Google Drive」「Microsoft Sharepoint」「Microsoft Teams」などのツールをつなぐための設定をまとめて管理できる。また、サードパーティーのMCP（Model Context Protocol）ツールにも対応する。

ChatKitでエージェントとのチャット体験を統合

　AIエージェントのチャット画面を動かすには、リアルタイムでのメッセージ表示や会話のスレッド管理、モデルの思考表示など複雑な設定が必要になることがある。ChatKitを使うことで、チャット型AIエージェントのアプリケーションやWebサイトへ埋め込み、テーマやブランドに合わせたカスタマイズが容易になるという。

Evalsの新機能でエージェントのパフォーマンスを測定

　本番環境に対応した信頼性の高いAIエージェントを構築するには、厳格なパフォーマンス評価が不可欠だ。OpenAIは、エージェントのパフォーマンスを測定、改善するための機能をEvalsプラットフォームに追加した。

　追加された機能は以下の通り。

データセット作成

　エージェントの評価用のデータを用意し、自動で採点したり人間が評価したりすることで、AIエージェントの評価を迅速に始められる。

トレース採点

　AIエージェントワークフローを自動で評価し、課題を特定する。

自動プロンプト最適化

　人の評価コメントや採点結果に基づき、より良いプロンプトを自動生成し、AIエージェントの改善に貢献する。

他社モデルのサポート

　OpenAI以外が提供するAIモデルもEvalsプラットフォームで評価できる。

強化ファインチューニングでAIエージェントのパフォーマンスを改善

　強化ファインチューニング（RFT）は、OpenAIのリーズニングモデルを開発者がカスタマイズできる機能だ。この機能は「OpenAI o4-mini」で一般提供されており、「GPT-5」ではプライベートβ版が提供されている。OpenAIはこのRFTのβ版に、エージェントのパフォーマンスを向上させるための以下の新機能を導入することを明らかにした。

カスタムツール呼び出し

　AIモデルが最適なタイミングで必要なツールを自動的に呼び出せるよう、AIモデルを訓練してリーズニングの質を高める。

カスタムグレーダー

　AIエージェントの利用ケースに合わせて、重要な評価基準を自由に設定できるようにし、より目的に合った性能評価ができるようになる。

　ChatKitとEvalsの新機能は、既に全開発者向けに一般提供されている。Agent Builderは2025年10月現在、β版が提供されており、Connector Registryは、「Global Admin Console」を持つ一部の「OpenAI API」「ChatGPT Enterprise」、教育機関の顧客向けにβ版の提供が開始された。これらのツールは全て、標準APIモデル料金に含まれる。

コーディング用の「GPT-5」チートシート（OpenAI公式）：プロンプト作成は「職人技」から「構造化エンジニアリング」へ
開発者向けに、GPT-5を最大限活用するための公式チートシートが話題に。プロンプト作成の基本が体系化され、初心者から上級者まで役立つ実践的な指針が示されている。
OpenAIの「Responses API」が機能拡充　「リモートMCPサーバサポート」「リーズニングサマリー」など
OpenAIは、エージェント型AIアプリケーションを構築するためのAPI「Responses API」におけるリモートMCPサーバのサポート、同APIで利用可能なビルトインツールの拡充を発表した、同APIの信頼性、可視性、プライバシーを向上させることが目的だ。
OpenAI・Oracle・ソフトバンク、米国5拠点でAIデータセンター拡張
2025年末までに10Gワット、5000億ドルを目指すStargate計画を前進。