OpenAIは、次世代推論AIモデル「o3」の軽量版となる「o3-mini」の一般提供を開始した。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
OpenAIは2025年1月31日(米国時間、以下同)、論理的思考力に重点を置いた最新世代AI(人工知能)モデル「OpenAI o3」の軽量版、「OpenAI o3-mini」の一般提供を開始した。2月12日には、ファイルや画像のアップロードに対応したことをX(旧:Twitter)で明らかにした。
o3-miniは同社の「ChatGPT」から利用できる。ChatGPTの「Plus」「Team」「Pro」のユーザーは、ChatGPTのモデル選択画面で「o3-mini」を選択することで利用を開始できる。無料プランでo3-miniを利用するには、チャットインタフェースに表示される[Reason]を選択する必要がある。「Enterprise」のユーザーは、近日中に利用可能になるという。
OpenAIのヘルプページによると、o3-miniのAPIは、Tier3~Tier5のAPIユーザーの一部に提供を開始しており、近日中に提供範囲を拡大する計画だという。
「o3-miniは、『o1-mini』と同等の低コスト、低レイテンシを維持している。科学、数学、コーディングの分野で優れたパフォーマンスを発揮するよう設計された最先端の推論モデルだ。検索機能と連携し、関連するWebソースへのリンクを含む最新の回答を提供することもできる」と、OpenAIは述べている。
OpenAIは、o3-miniが開発者にも親しみやすいモデルとする理由を、次のように解説している。
o3-miniのAPIを利用する際、開発者は「low」「medium」「high」の3段階の「Reasoning effort」(思考負荷)を選択できる。複雑な課題に対してはhighを選択することで「より深く考えさせる」ことができ、応答の遅延を懸念する場合には「low」を選択することで、思考より応答速度を優先するよう調整できるという。
なお、ChatGPTの有料ユーザーが選択できる「o3-mini-high」は、Reasoning effortがHighに設定されており、応答速度には時間がかかるものの、より高度な思考が適用されるという。
o1-miniや「o1-preview」と同様、「Streaming」形式の応答に対応する他、「Function calling」「Structured Outputs」「Developer message」など、開発者から多くの要望が寄せられていた機能に対応している。開発者は、これらの機能を活用して本番アプリケーションにo3-miniを統合できるという。
競技プログラミングサイト「Codeforces」を用いたベンチマークでは、o3-miniのReasoning Effortを高めるにつれてイロスコア(Elo Score)が向上し、いずれの設定においてもo1-miniを上回る成績を収めたという。なお、Reasoning Effortをmediumにした場合は、o1と同等のパフォーマンスを発揮したという。
GitHubから収集されたソフトウェア開発の課題をAIで自動的に解決する機能を評価するベンチマーク「SWE-bench Verified」では、これまでに公開されたモデルの中で、最も高いパフォーマンスを発揮したという。
OpenAIは、o3-miniの安全な応答を実現する取り組みについて「『Deliberative Alignment』(熟慮的アライメント)を採用し、モデルがユーザーのプロンプトに回答する前に、人間が作成した安全基準に基づいて推論するよう訓練されている。o3-miniの展開前には、o1と同様のアプローチを用いて準備し、外部のレッドチームと共同で、安全性とリスクについて慎重な評価を実施した」と述べている。
Copyright © ITmedia, Inc. All Rights Reserved.
Smart & Social 記事ランキング