Snowflake、エンタープライズタスク向け大規模言語モデル「Snowflake Arctic」を発表:個人、研究、商用利用も可能 優れた効率性をうたう
Snowflakeは、エンタープライズAIに最適なLLM「Snowflake Arctic」を発表した。エンタープライズインテリジェンス、画期的な効率性、真のオープン性という特徴を備える。
クラウドデータプラットフォームを提供するSnowflakeは2024年4月24日(米国時間)、エンタープライズAI(人工知能)に最適な大規模言語モデル(LLM)「Snowflake Arctic」を発表した。
Snowflake Arcticは以下の3つの特徴を持つ。
Snowflake Arcticの特徴
エンタープライズインテリジェンス
複雑なエンタープライズワークロード向けに最適化されており、SQLコードの生成や指示実行(Instruction Following)など数々の業界ベンチマークを塗り替えている。
画期的な効率性
独自のDense-MoE(Mixture-of-Experts)Hybridトランスフォーマーアーキテクチャにより、同等モデルの数分の1の開発コストで「トップクラスの結果を実現している」とした。
真のオープン性
制約のない個人利用、研究利用、商用利用を認めるApache License 2.0により、Arcticの重み(weight)とコードを公開しており、データレシピとトレーニング手法の研究詳細もオープンソース化している。
エンタープライズインテリジェンスに関するベンチマーク
Snowflakeは、企業におけるAIニーズおよびユースケースの一般的なパターンとして「企業はLLMを使用して、会話型SQLデータコパイロット、コードコパイロット、RAG(検索拡張生成)チャットbotを構築したいと考えている」との認識を示す。
指標の観点から見ると、これはSQL、コーディング、複雑な指示の実行、根拠のある回答の生成能力に優れたLLMを意味する。そこでSnowflakeは、これらの能力を「エンタープライズインテリジェンス」と呼ぶ単一の指標にまとめて、一括して捉えている。この指標は、SQLコード生成(Spider)、コーディング(HumanEval+とMBPP+)、指示実行(IFEval)の平均を取ったものだ。
Snowflakeは下のグラフで、エンタープライズインテリジェンス指標を構成するこれらの各タスクとアカデミックタスク(数学、常識、一般言語理解)について、Snowflake Arcticと他のオープンLLM(「DBRX」「Llama3 70B」「Mixtral 8x22B」「Mixtral 8x7B」)を比較した結果を紹介し、特にエンタープライズタスクでのArcticの強みをアピールしている。
優れたリソース効率性
Snowflakeは、Snowflake Arcticと他のオープンLLMにおけるトレーニングと推論の効率性を比較した下のプロット図を紹介している。図の縦軸の「エンタープライズインテリジェンス」は、前述したSQLコード生成、コーディング、指示実行のベンチマークの平均だ。
顧客がニーズに合った高品質のカスタムモデルを低コストで作成できる、コスト効率の高いトレーニングの新しいベースラインを実現したと、Snowflakeは述べている。
Snowflake Arcticの提供
Snowflake Arcticは現在、機械学習やAIソリューションをデータクラウドで提供するSnowflakeのフルマネージドサービス「Snowflake Cortex」におけるサーバレス推論で利用可能だ。Hugging Face、Lamini、Microsoft Azure、NVIDIA APIカタログ、Perplexity、Together AIといったモデルガーデンやカタログとともに、Amazon Web Services(AWS)でも近日中に提供予定としている。
Snowflake Arcticモデルファミリー
Snowflake Arcticのモデルファミリーには、Apache License 2.0で先日公開された最先端のテキスト埋め込みモデルファミリー「Arctic embed」も含まれる。現在Hugging Faceで5モデルが提供されており、Snowflake Cortexの埋め込み機能でも近日中に提供開始される(プライベートプレビュー中)。
これらの埋め込みモデルは、非常に高い検索性能を類似モデルの約3分の1のサイズで提供できるよう、最適化済みだという。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- Meta、次世代オープンLLM「Meta Llama 3」を発表
Metaは、大規模言語モデル「Meta Llama 3」の8Bおよび70Bパラメーターモデルを発表した。 - Snowflake、Redshift、PostgresSQLと連携可能な表計算ソフト「Row Zero」発表
Row Zeroは、表計算ソフトウェア「Row Zero」を発表した。「Microsoft Excel」や「Google Sheets」のような見た目と操作性を持ちながら、100倍高速だとしている。 - NVIDIAとSnowflakeが「企業の貴重なデータを生成AIに変えるサービス」を提供開始
NVIDIAとSnowflakeは、生成AIを素早く構築するため提携したと発表した。Snowflakeのデータを使用して生成AI用のカスタム大規模言語モデルを構築できるという。