検索
ニュース

Snowflake、エンタープライズタスク向け大規模言語モデル「Snowflake Arctic」を発表個人、研究、商用利用も可能 優れた効率性をうたう

Snowflakeは、エンタープライズAIに最適なLLM「Snowflake Arctic」を発表した。エンタープライズインテリジェンス、画期的な効率性、真のオープン性という特徴を備える。

Share
Tweet
LINE
Hatena

 クラウドデータプラットフォームを提供するSnowflakeは2024年4月24日(米国時間)、エンタープライズAI(人工知能)に最適な大規模言語モデル(LLM)「Snowflake Arctic」を発表した。

 Snowflake Arcticは以下の3つの特徴を持つ。

Snowflake Arcticの特徴

エンタープライズインテリジェンス

 複雑なエンタープライズワークロード向けに最適化されており、SQLコードの生成や指示実行(Instruction Following)など数々の業界ベンチマークを塗り替えている。

画期的な効率性

 独自のDense-MoE(Mixture-of-Experts)Hybridトランスフォーマーアーキテクチャにより、同等モデルの数分の1の開発コストで「トップクラスの結果を実現している」とした。

真のオープン性

 制約のない個人利用、研究利用、商用利用を認めるApache License 2.0により、Arcticの重み(weight)とコードを公開しており、データレシピとトレーニング手法の研究詳細もオープンソース化している。

エンタープライズインテリジェンスに関するベンチマーク

 Snowflakeは、企業におけるAIニーズおよびユースケースの一般的なパターンとして「企業はLLMを使用して、会話型SQLデータコパイロット、コードコパイロット、RAG(検索拡張生成)チャットbotを構築したいと考えている」との認識を示す。

 指標の観点から見ると、これはSQL、コーディング、複雑な指示の実行、根拠のある回答の生成能力に優れたLLMを意味する。そこでSnowflakeは、これらの能力を「エンタープライズインテリジェンス」と呼ぶ単一の指標にまとめて、一括して捉えている。この指標は、SQLコード生成(Spider)、コーディング(HumanEval+とMBPP+)、指示実行(IFEval)の平均を取ったものだ。

 Snowflakeは下のグラフで、エンタープライズインテリジェンス指標を構成するこれらの各タスクとアカデミックタスク(数学、常識、一般言語理解)について、Snowflake Arcticと他のオープンLLM(「DBRX」「Llama3 70B」「Mixtral 8x22B」「Mixtral 8x7B」)を比較した結果を紹介し、特にエンタープライズタスクでのArcticの強みをアピールしている。

エンタープライズタスクとアカデミックタスクでのSnowflake Arcticと他のオープンLLMの比較(提供:Snowflake)
エンタープライズタスクとアカデミックタスクでのSnowflake Arcticと他のオープンLLMの比較(提供:Snowflake)

優れたリソース効率性

 Snowflakeは、Snowflake Arcticと他のオープンLLMにおけるトレーニングと推論の効率性を比較した下のプロット図を紹介している。図の縦軸の「エンタープライズインテリジェンス」は、前述したSQLコード生成、コーディング、指示実行のベンチマークの平均だ。

低い開発コストでトップクラスの結果を出すSnowflake Arctic(提供:Snowflake)
低い開発コストでトップクラスの結果を出すSnowflake Arctic(提供:Snowflake)
エキスパートの最適利用によって高い推論パフォーマンスを発揮するSnowflake Arctic(提供:Snowflake)
エキスパートの最適利用によって高い推論パフォーマンスを発揮するSnowflake Arctic(提供:Snowflake)

 顧客がニーズに合った高品質のカスタムモデルを低コストで作成できる、コスト効率の高いトレーニングの新しいベースラインを実現したと、Snowflakeは述べている。

Snowflake Arcticの提供

 Snowflake Arcticは現在、機械学習やAIソリューションをデータクラウドで提供するSnowflakeのフルマネージドサービス「Snowflake Cortex」におけるサーバレス推論で利用可能だ。Hugging Face、Lamini、Microsoft Azure、NVIDIA APIカタログ、Perplexity、Together AIといったモデルガーデンやカタログとともに、Amazon Web Services(AWS)でも近日中に提供予定としている。

Snowflake Arcticモデルファミリー

 Snowflake Arcticのモデルファミリーには、Apache License 2.0で先日公開された最先端のテキスト埋め込みモデルファミリー「Arctic embed」も含まれる。現在Hugging Faceで5モデルが提供されており、Snowflake Cortexの埋め込み機能でも近日中に提供開始される(プライベートプレビュー中)。

 これらの埋め込みモデルは、非常に高い検索性能を類似モデルの約3分の1のサイズで提供できるよう、最適化済みだという。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る