Stability AIは、テキストやコードを生成できる、オープンソースの言語モデル「StableLM」を公開した。「CC BY-SA-4.0」ライセンスに基づき、研究だけでなく、商用目的でも利用できる。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
Stability AIは2023年4月19日、テキストやコードを生成できる、オープンソースの言語モデル「StableLM」を公開した。Stability AIのGitHubリポジトリに公開されており、クリエイティブ・コモンズ・ライセンス「CC BY-SA-4.0」で利用できる。
StableLMは、Stability AIが非営利の研究ハブであるEleutherAIと共同でオープンソース化した初期の言語モデルを基盤としている。この言語モデルは「GPT-J」や「GPT-NeoX」「Pythiasuite」を含んでいる。Stability AIによると「最近のオープンソース言語モデルの多くは、これらの取り組みを基に開発されている」という。
StableLMは、「The Pile」を基に構築した新しい実験用データセットで学習しており、データ規模はThe Pileの3倍に当たるという。コンテンツ量は1.5兆トークン。他の大規模言語モデル(「Alpaca」「GPT4All」「Dolly」「ShareGPT」「HH」)用に調整したモデルも提供する。なお、このモデルは「CC BY-NC-SA 4.0」で公開されるため、研究用としてのみ使用可能だ。
Stability AIは「言語モデルはデジタル経済のバックボーンを形成するものであり、その設計に対して誰もが意見を述べられるようにしたい。StableLMは、透明性が高く、アクセスしやすく、支持されるAI技術へのわれわれのコミットメントを示すため、オープンソースを採用した」と述べている。
現在はα版として30億パラメーターと70億パラメーターのモデルを利用できる。「今後は150億〜650億パラメーターのモデルも用意する」としている。
Copyright © ITmedia, Inc. All Rights Reserved.