検索
ニュース

xAI、X上でリアルタイムに情報処理できるLLM「Grok-2」「Grok-2 mini」β版をリリース 性能はGPT-4oに匹敵?コーディングも支援

xAIはGrok-2のβ版をリリースした。Grok-2は最先端の推論機能を備えたLLMで、X PremiumまたはPremium+ユーザーは、Xアプリ上で利用できる。

Share
Tweet
LINE
Hatena

 xAIは2024年8月13日(米国時間)、大規模言語モデル(LLM)「Grok-2」のβ版をリリースした。今回のリリースにはGrok-2と「Grok-2 mini」という2つのGrokファミリーが含まれている。両モデルは、X(旧Twitter)上でリリースされており、エンタープライズAPIを通じて両モデルを利用できる。

Grok-2の特徴と性能

 同社によると、Grok-2は、チャット、コーディング、推論などの機能を備えており、前モデルのGrok-1.5から大きく進化したという。Grok-2 miniはGrok-2より軽量な姉妹モデルという位置付けだ。

 Grok-2の初期バージョンは、「sus-column-r」という名前で言語モデルのベンチマークプラットフォーム「LMSYS」でテストされていた。2024年9月時点で、LMSYSのリーダーボードでは、Grok-2は総合スコアでClaude 3.5 SonnetとGPT-4-Turboの両方を上回っている。


(提供:xAI)

 xAI内でも、LMSYSと同様のプロセスでモデルを評価しているという。その結果、Grok-2は、検索されたコンテンツを使った推論で大幅な改善が見られた。また、欠落情報の特定や、一連の流れを通じた推論、無関係な投稿の破棄といった情報処理能力に優れていることが判明した。

 「Grok-2とGrok-2 miniのどちらも、以前の『Grok-1.5』よりも大幅に性能が向上した」(xAI)

Grok-2、Grok-2 miniの利用方法

 X PremiumまたはPremium+に加入しているユーザーは、Grok-2とGrok-2 miniを利用できる。Grok-2は、最新バージョンにアップデートしたXアプリのGrokタブからアクセスでき、Xから得られるリアルタイムの情報を統合する。

 Grok-2 miniは、スピードと回答の質のバランスを重視するモデルだ。前モデルと比較して、Grok-2はより直感的で操作性に優れ、質問への回答や共同執筆、コーディングなどのタスクを処理できる。Grokの機能をXで拡張するために、Black Forest LabsのFLUX.1モデルを実験的に使用している。

エンタープライズAPI

 Grok-2およびGrok-2 miniは、2024年8月末に新しいエンタープライズAPIプラットフォームを通じて開発者にリリースされている。APIは、マルチリージョンデプロイを可能にする新しいカスタムテクノロジースタック上に構築されている。多要素認証(「YubiKey」やAppleのTouch ID、TOTP《Time-based One-Time Password》など)、豊富なトラフィック統計、高度な課金分析(詳細なデータエクスポートを含む)など、強化されたセキュリティ機能を提供する。加えて、チーム、ユーザー、課金管理を既存の社内ツールやサービスに統合できる管理APIも提供している。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る