Snowflakeは、エンタープライズAIに最適なLLM「Snowflake Arctic」を発表した。エンタープライズインテリジェンス、画期的な効率性、真のオープン性という特徴を備える。
クラウドデータプラットフォームを提供するSnowflakeは2024年4月24日(米国時間)、エンタープライズAI(人工知能)に最適な大規模言語モデル(LLM)「Snowflake Arctic」を発表した。
Snowflake Arcticは以下の3つの特徴を持つ。
複雑なエンタープライズワークロード向けに最適化されており、SQLコードの生成や指示実行(Instruction Following)など数々の業界ベンチマークを塗り替えている。
独自のDense-MoE(Mixture-of-Experts)Hybridトランスフォーマーアーキテクチャにより、同等モデルの数分の1の開発コストで「トップクラスの結果を実現している」とした。
制約のない個人利用、研究利用、商用利用を認めるApache License 2.0により、Arcticの重み(weight)とコードを公開しており、データレシピとトレーニング手法の研究詳細もオープンソース化している。
Snowflakeは、企業におけるAIニーズおよびユースケースの一般的なパターンとして「企業はLLMを使用して、会話型SQLデータコパイロット、コードコパイロット、RAG(検索拡張生成)チャットbotを構築したいと考えている」との認識を示す。
指標の観点から見ると、これはSQL、コーディング、複雑な指示の実行、根拠のある回答の生成能力に優れたLLMを意味する。そこでSnowflakeは、これらの能力を「エンタープライズインテリジェンス」と呼ぶ単一の指標にまとめて、一括して捉えている。この指標は、SQLコード生成(Spider)、コーディング(HumanEval+とMBPP+)、指示実行(IFEval)の平均を取ったものだ。
Snowflakeは下のグラフで、エンタープライズインテリジェンス指標を構成するこれらの各タスクとアカデミックタスク(数学、常識、一般言語理解)について、Snowflake Arcticと他のオープンLLM(「DBRX」「Llama3 70B」「Mixtral 8x22B」「Mixtral 8x7B」)を比較した結果を紹介し、特にエンタープライズタスクでのArcticの強みをアピールしている。
Snowflakeは、Snowflake Arcticと他のオープンLLMにおけるトレーニングと推論の効率性を比較した下のプロット図を紹介している。図の縦軸の「エンタープライズインテリジェンス」は、前述したSQLコード生成、コーディング、指示実行のベンチマークの平均だ。
顧客がニーズに合った高品質のカスタムモデルを低コストで作成できる、コスト効率の高いトレーニングの新しいベースラインを実現したと、Snowflakeは述べている。
Snowflake Arcticは現在、機械学習やAIソリューションをデータクラウドで提供するSnowflakeのフルマネージドサービス「Snowflake Cortex」におけるサーバレス推論で利用可能だ。Hugging Face、Lamini、Microsoft Azure、NVIDIA APIカタログ、Perplexity、Together AIといったモデルガーデンやカタログとともに、Amazon Web Services(AWS)でも近日中に提供予定としている。
Snowflake Arcticのモデルファミリーには、Apache License 2.0で先日公開された最先端のテキスト埋め込みモデルファミリー「Arctic embed」も含まれる。現在Hugging Faceで5モデルが提供されており、Snowflake Cortexの埋め込み機能でも近日中に提供開始される(プライベートプレビュー中)。
これらの埋め込みモデルは、非常に高い検索性能を類似モデルの約3分の1のサイズで提供できるよう、最適化済みだという。
Copyright © ITmedia, Inc. All Rights Reserved.