ブラウザを操作してタスクを実行するAIエージェント「Operator」 基盤モデル「Computer-Using Agent」とは?Operatorは「CAPTCHA」認証の回答を人間に依頼する

OpenAIは、Webにアクセスしてユーザーの代わりにタスクを実行するエージェント「Operator」のリサーチプレビュー版をリリースした。

» 2025年01月29日 08時00分 公開
[@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 OpenAIは2025年1月23日(米国時間)、Webにアクセスしてユーザーの代わりにタスクを実行できるエージェント「Operator」のリサーチプレビュー版をリリースした。

 Operatorは、独自のブラウザを使用して機能する。ユーザーがブラウザにタスクを入力して指示すると、OperatorはWebページにアクセスし、入力、クリック、スクロールなどによってブラウザを操作し、指示されたタスクを実行する。フォームの入力や買い物など、日常的なさまざまなタスクに対応できる。

 Operatorのリサーチプレビュー版は現在、米国の「ChatGPT」の「Pro」プラン(月額200ドル)のユーザーが利用できる。OpenAIはOperatorをまず小規模に展開し、ユーザーやエコシステムからのフィードバックを踏まえて機能や安全対策を改善し、洗練させていく。より長く、複雑なワークフローを処理できるように進化させていく計画だ。

 「大規模に展開しても十分な安全性や使いやすさが確保できると判断した段階で、『Plus』『Team』『Enterprise』プランのユーザー向けにもOperatorを展開していく。Operatorの機能をChatGPTに直接統合し、シームレスなリアルタイムおよび非同期のタスク実行を可能にする」と、OpenAIは述べている。

Operatorの基盤となる、「Computer-Using Agent」とは?

Copyright © ITmedia, Inc. All Rights Reserved.

スポンサーからのお知らせPR

注目のテーマ

4AI by @IT - AIを作り、動かし、守り、生かす
Microsoft & Windows最前線2025
AI for エンジニアリング
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。