3140億パラメーターのLLM「Grok-1」をオープンソース化 イーロン・マスク氏設立のxAIAIチャットbot「Grok」の基盤

xAIは、大規模言語モデル「Grok-1」の基本モデルの重みとネットワークアーキテクチャを、Apache 2.0ライセンスでオープンソースとして公開した。

» 2024年03月22日 08時00分 公開
[@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 xAIは2024年3月17日(米国時間)、大規模言語モデル(LLM)「Grok-1」の基本モデルの重みとネットワークアーキテクチャを、Apache 2.0ライセンスでオープンソースとして公開した。xAIは、米著名経営者のイーロン・マスク氏が2023年7月に設立した。

 Grok-1は、xAIが2023年11月に発表したAIチャットbot「Grok」のベースとなるLLM。3140億パラメーターを持つMixture-of-Experts(MoE:混合エキスパート)モデルだ。与えられたトークンに対して重みの25%がアクティブになる。質問回答や情報検索、創作、コーディング支援などの自然言語処理タスクでの使用が想定されている。

 2023年10月に終了したGrok-1の事前トレーニングフェーズからの生のベースモデルチェックポイントであり、大量のテキストデータでトレーニングされている。xAIによると、「Rust」と「JAX」(オープンソースのPythonライブラリ)上でカスタムトレーニングスタックを使って、xAIによって一からトレーニングされた。ただし、特定のアプリケーション(対話のような)向けにファインチューニングされたモデルではない。

モデルの使用

 Grok-1基本モデルの重みは、GitHubリポジトリとHugging Faceページからダウンロードできる。GitHubリポジトリでは、Grok-1をテストするためのJAXサンプルコードも配布されている。

 モデルのサイズが大きいため、サンプルコードでモデルをテストするには、十分なGPUメモリを搭載するマシンが必要になる。

Copyright © ITmedia, Inc. All Rights Reserved.

スポンサーからのお知らせPR

Smart & Social 鬮ォ�ェ陋滂ソス�ス�コ闕オ譁溷クキ�ケ譎「�ス�ウ驛「�ァ�ス�ュ驛「譎「�ス�ウ驛「�ァ�ス�ー

髫エ蟷「�ス�ャ髫エ魃会スス�・髫エ蟶キ�」�ッ闖ォ�」

注目のテーマ

4AI by @IT - AIを作り、動かし、守り、生かす
Microsoft & Windows最前線2025
AI for エンジニアリング
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。