検索
ニュース

ブラウザを操作してタスクを実行するAIエージェント「Operator」 基盤モデル「Computer-Using Agent」とは?Operatorは「CAPTCHA」認証の回答を人間に依頼する

OpenAIは、Webにアクセスしてユーザーの代わりにタスクを実行するエージェント「Operator」のリサーチプレビュー版をリリースした。

Share
Tweet
LINE
Hatena

 OpenAIは2025年1月23日(米国時間)、Webにアクセスしてユーザーの代わりにタスクを実行できるエージェント「Operator」のリサーチプレビュー版をリリースした。

 Operatorは、独自のブラウザを使用して機能する。ユーザーがブラウザにタスクを入力して指示すると、OperatorはWebページにアクセスし、入力、クリック、スクロールなどによってブラウザを操作し、指示されたタスクを実行する。フォームの入力や買い物など、日常的なさまざまなタスクに対応できる。

 Operatorのリサーチプレビュー版は現在、米国の「ChatGPT」の「Pro」プラン(月額200ドル)のユーザーが利用できる。OpenAIはOperatorをまず小規模に展開し、ユーザーやエコシステムからのフィードバックを踏まえて機能や安全対策を改善し、洗練させていく。より長く、複雑なワークフローを処理できるように進化させていく計画だ。

 「大規模に展開しても十分な安全性や使いやすさが確保できると判断した段階で、『Plus』『Team』『Enterprise』プランのユーザー向けにもOperatorを展開していく。Operatorの機能をChatGPTに直接統合し、シームレスなリアルタイムおよび非同期のタスク実行を可能にする」と、OpenAIは述べている。

Operatorの基盤となる、「Computer-Using Agent」とは?

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る