ニュース
ブラウザを操作してタスクを実行するAIエージェント「Operator」 基盤モデル「Computer-Using Agent」とは?:Operatorは「CAPTCHA」認証の回答を人間に依頼する
OpenAIは、Webにアクセスしてユーザーの代わりにタスクを実行するエージェント「Operator」のリサーチプレビュー版をリリースした。
OpenAIは2025年1月23日(米国時間)、Webにアクセスしてユーザーの代わりにタスクを実行できるエージェント「Operator」のリサーチプレビュー版をリリースした。
Operatorは、独自のブラウザを使用して機能する。ユーザーがブラウザにタスクを入力して指示すると、OperatorはWebページにアクセスし、入力、クリック、スクロールなどによってブラウザを操作し、指示されたタスクを実行する。フォームの入力や買い物など、日常的なさまざまなタスクに対応できる。
Operatorのリサーチプレビュー版は現在、米国の「ChatGPT」の「Pro」プラン(月額200ドル)のユーザーが利用できる。OpenAIはOperatorをまず小規模に展開し、ユーザーやエコシステムからのフィードバックを踏まえて機能や安全対策を改善し、洗練させていく。より長く、複雑なワークフローを処理できるように進化させていく計画だ。
「大規模に展開しても十分な安全性や使いやすさが確保できると判断した段階で、『Plus』『Team』『Enterprise』プランのユーザー向けにもOperatorを展開していく。Operatorの機能をChatGPTに直接統合し、シームレスなリアルタイムおよび非同期のタスク実行を可能にする」と、OpenAIは述べている。
Operatorの基盤となる、「Computer-Using Agent」とは?
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- OpenAIの「o1」モデルが「GitHub Copilot」と「GitHub Models」で利用可能に どのプランで使える?
GitHubは、AIコードアシスタント「GitHub Copilot」とAIアプリ開発支援サービス「GitHub Models」で、OpenAIの最新AIモデル「o1」を利用できるようにした。 - 高度なAIでAIをテスト OpenAIが実践するAIモデルのレッドチーム演習とは
OpenAIはレッドチーム演習に関する2つの論文を公開した。安全で有益なAIの実現を支援するために、人とAIを使ったレッドチーム演習がどのように進歩しているかが説明されている。 - 群雄割拠の生成AI みんなが今、実際に使っているツールは何?
SHIFT AIは「2024年AIトレンドランキング」を発表した。2024年話題になったと思う生成AIツールと実際に今使っている生成AIツール、実際に今使っている情報収集AIツールのトップは「ChatGPT」だった。