OpenAI、大規模言語モデル「OpenAI o1-preview」シリーズを発表　他モデルとの違いは？：高速で安価な「o1-mini」も同時にリリース

OpenAIはOpenAI o1-previewとo1-miniをリリースした。本稿では、これまでのモデルとの違いや利用可能なユーザー、利用制限などについて取り上げる。

[＠IT] PC用表示関連情報

LINE

Hatena

　OpenAIは2024年9月12日（米国時間）、大規模言語モデル（LLM）「OpenAI o1-preview」と「OpenAI o1-mini」をリリースした。OpenAIは以下のように説明している。

OpenAI o1シリーズとは、他モデルとの違いは？

　OpenAIが開発したOpenAI o1シリーズは、複雑なタスクを推論でき、これまでのモデルよりも科学、コーディング、数学などで難しい問題を解決できるという。

仕組みとパフォーマンス

　OpenAIのテストでは、物理学、化学、生物学の難易度の高いベンチマークタスクにおいて、o1シリーズは博士課程の学生と同様のパフォーマンスを示した。また、数学とコーディングにおいても優れていることが分かった。

　国際数学オリンピック（IMO）の予選試験では、GPT-4oは問題の13％しか正しく解けなかったのに対し、o1シリーズは83％のスコアを出した。また、コーディング能力はコンテストで評価され、Codeforcesコンペティションでは89パーセンタイル（89％より優れた成績）に達した。

　複雑な推論タスクについても大きな進歩を見せ、AIの新しい可能性を示したため、同社はこれを新シリーズの1番目として「OpenAI o1」と名付けた。

　2024年9月時点では初期モデルのため、Web閲覧やファイルや画像のアップロードなど、ChatGPTにある機能の多くをまだ備えていない。同社によると、「多くのケースについては、近いうちにGPT-4oの方がより高性能になると考えられる」という。

安全性

　新しい大規模言語モデル開発の一環として、OpenAIは安全性とアライメントのガイドラインを順守させるために、推論能力を活用する新しいセーフティトレーニングアプローチを考案した。このセーフティルールを文脈の中で推論できるようになることで、より効果的に適用できるという。

　安全性を測定する方法の一つに、OpenAIはユーザーがセーフティルールを迂回（うかい）しようとした場合（「脱獄」と呼ばれる）、o1がどれだけセーフティルールに従い続けるかについてのテストを挙げている。同社が用意した最も難しい脱獄テストの一つでは、GPT-4oは100点満点中22点だったが、o1-previewは84点を獲得した。

　o1シリーズの新機能に対応するため、OpenAIは安全対策、内部ガバナンス、連邦政府との連携を強化した。これには、同社の「Preparedness Framework」を使用した厳格なテストと評価、レッドチーミング、セーフティ＆セキュリティ委員会を含む取締役会レベルのレビュープロセスが含まれている。

対象者

　o1シリーズの強化された推論機能は、科学、コーディング、数学などの複雑な問題に取り組む際に特に役立つ可能性があると同社はいい、以下の事例を挙げている。

医療研究者が細胞シーケンシングデータに注釈を付ける
物理学者が量子光学に必要な複雑な数式を生成する
あらゆる分野の開発者がマルチステップワークフローを構築し実行する

OpenAI o1-mini

　OpenAI o1より高速で安価な推論モデルのOpenAI o1-miniもリリースされた。同社によると特にコーディングに効果的だという。o1シリーズは、複雑なコードを正確に生成、デバッグすることに強みがある。o1-miniはo1-previewよりも80％安価に使用できる。

OpenAI o1の使い方

　ChatGPT PlusとTeamユーザーは、ChatGPTでo1シリーズにアクセスできる。o1-previewとo1-miniはモデル選択ツールを使って手動で選択可能だ。ローンチ時の週レート制限はo1-previewが30クエリ、o1-miniが50クエリとなる（※）。同社はこれらのレートを増加させるとともに、ChatGPTが与えられたプロンプトに対して自動的に適切なモデルを選択できるよう取り組んでいる。

（※）2024年9月17日に、o1-previewの場合は週50クエリ、o1-miniの場合は1日50クエリに増加した

ChatGPT Enterprise／Eduのユーザーは両方のモデルにアクセスできる（提供：OpenAI）

　API利用ティアが5の開発者（1000ドルを支払い、最初の支払い成功から30日以上経過したユーザー）は、APIで両モデルのプロトタイピングを20RPM（1分当たりのリクエスト数）のレート制限で開始できる。OpenAIは追加テストの後、制限量を増やすよう取り組んでいる。これらのモデルのAPIには2024年10月時点では、関数呼び出し、ストリーミング、システムメッセージのサポート、その他の機能は含まれていない。

　OpenAIは今後、全てのChatGPTフリーユーザーにo1-miniへのアクセス提供を予定している。

OpenAI、大規模言語モデル「OpenAI o1-preview」シリーズを発表　他モデルとの違いは？：高速で安価な「o1-mini」も同時にリリース

OpenAI o1シリーズとは、他モデルとの違いは？

仕組みとパフォーマンス

安全性

対象者

OpenAI o1-mini

OpenAI o1の使い方

関連記事

関連リンク

Smart & Social 記事ランキング

OpenAI、大規模言語モデル「OpenAI o1-preview」シリーズを発表 他モデルとの違いは？：高速で安価な「o1-mini」も同時にリリース

OpenAI o1シリーズとは、他モデルとの違いは？

仕組みとパフォーマンス

安全性

対象者

OpenAI o1-mini

OpenAI o1の使い方

関連記事

関連リンク

Smart & Social 記事ランキング

OpenAI、大規模言語モデル「OpenAI o1-preview」シリーズを発表　他モデルとの違いは？：高速で安価な「o1-mini」も同時にリリース