検索
ニュース

「Stable Diffusion」で話題のStability AIが、テキスト生成言語モデルを公開商用でも利用可能

Stability AIは、テキストやコードを生成できる、オープンソースの言語モデル「StableLM」を公開した。「CC BY-SA-4.0」ライセンスに基づき、研究だけでなく、商用目的でも利用できる。

Share
Tweet
LINE
Hatena

 Stability AIは2023年4月19日、テキストやコードを生成できる、オープンソースの言語モデル「StableLM」を公開した。Stability AIのGitHubリポジトリに公開されており、クリエイティブ・コモンズ・ライセンス「CC BY-SA-4.0」で利用できる。

画像
Stability AIのブログから引用

他の大規模言語モデル用に調整したものも公開

 StableLMは、Stability AIが非営利の研究ハブであるEleutherAIと共同でオープンソース化した初期の言語モデルを基盤としている。この言語モデルは「GPT-J」や「GPT-NeoX」「Pythiasuite」を含んでいる。Stability AIによると「最近のオープンソース言語モデルの多くは、これらの取り組みを基に開発されている」という。

 StableLMは、「The Pile」を基に構築した新しい実験用データセットで学習しており、データ規模はThe Pileの3倍に当たるという。コンテンツ量は1.5兆トークン。他の大規模言語モデル(「Alpaca」「GPT4All」「Dolly」「ShareGPT」「HH」)用に調整したモデルも提供する。なお、このモデルは「CC BY-NC-SA 4.0」で公開されるため、研究用としてのみ使用可能だ。

 Stability AIは「言語モデルはデジタル経済のバックボーンを形成するものであり、その設計に対して誰もが意見を述べられるようにしたい。StableLMは、透明性が高く、アクセスしやすく、支持されるAI技術へのわれわれのコミットメントを示すため、オープンソースを採用した」と述べている。

 現在はα版として30億パラメーターと70億パラメーターのモデルを利用できる。「今後は150億〜650億パラメーターのモデルも用意する」としている。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る