GPT-4に次ぐ性能？　LLM「Mistral Large」が登場　Azureでも利用可能：多言語対応、文化的背景理解に強み

Mistral AIがリリースしたLLM、Mistral Largeはテキスト理解、変換、コード生成などさまざまなタスクに活用できる。MistralはAzure AI Studioなどで利用できる。

» 2024年03月13日 08時00分公開

[＠IT]

印刷

鬯ｮ�ｫ驕ｨ繧托ｽｽ�ｹ隴趣ｽ｢�ｽ�ｽ�ｽ�ｽPost

Shareシェア

はてなブックマーク

SharePocket Button

この記事は会員限定です。会員登録（無料）すると全てご覧いただけます。

　フランスのAIスタートアップ企業であるMistral AIは、2024年2月26日（フランス時間）、大規模言語モデル（LLM）「Mistral Large」をリリースした。Mistral Largeは「Microsoft Azure」上で利用できる。低遅延ワークロードに対応したLLM、「Mistral Small」の提供も開始した。

Mistral AIのフラグシップモデル Mistral Large

　Mistral AIによると、Mistral Largeは高性能のテキスト生成モデルであり、高いレベルの推論能力を備えており、テキスト理解、変換、コード生成を含む複雑な多言語推論タスクに使用できるという。

　同社の発表では、Mistral Largeは標準的なベンチマークで高い結果を達成している。APIを通じて一般に利用可能なモデルとしては、GPT-4に次いで世界第2位と主張している。

MMLU（大規模マルチタスク言語理解を測るために設計されたベンチマーク）の比較（提供：Mistral AI）

Mistral Largeの機能と強み

　同社が主張するMistral Largeの機能と強みは以下の通り。

多言語対応と文化的背景の理解

　英語、フランス語、スペイン語、ドイツ語、イタリア語にネイティブに対応し、文法や文化的背景を理解できる。

3万2000トークンのコンテキストウィンドウ

　コンテキストウィンドウのトークン数が3万2000あるため、大きいサイズのドキュメントを理解できる。

指示や命令に対する正確な応答

　命令を正確に遂行する能力が高いため、開発者はモデレーションポリシーの設計が可能になる。

ネイティブで関数の呼び出しが可能

　関数呼び出しのネイティブサポートで、大規模で複雑なアプリケーションの開発や更新が効果的に行える。

Microsoftと提携し、Azure上でモデルを提供

　Mistral Largeは2024年3月時点、以下の方法で利用可能だ。

La Plateforme：Mistral AIのインフラでホストされているアクセスポイント「La Plateforme」で、アプリケーションやサービスを作成できる
Azure：「Azure AI Studio」と「Azure Machine Learning」でも利用できる
セルフデプロイメント：開発者自身の環境にデプロイし、モデルの重み付けができる。これにより、センシティブな情報を扱うユースケースに対応できる。利用には、Mistral AIへの問い合わせが必要

Mistral Largeの性能

　一般的に使用されるベンチマークで、Mistral Largeの性能をトップクラスのLLMモデルと比較した結果は以下の通り。

推論と知識

　Mistral Largeは推論能力に強みを持っているという。「MMLU」（大規模マルチタスク言語理解を測るために設計されたベンチマーク）をはじめ、「HellaSwag」「WinoGrande」など7つのベンチマークでパフォーマンスを比較した結果を以下に示す。

LLMモデルの広範な常識、推論、知識ベンチマークにおけるパフォーマンス比較（提供：Mistral AI）

多言語対応

　Mistral Largeはフランス語、ドイツ語、スペイン語、イタリア語に対応している。

フランス語、ドイツ語、スペイン語、イタリア語でのパフォーマンス比較（提供：Mistral AI）

数学とコーディング

　Mistral Largeは、数学とコーディングのタスクで高いパフォーマンスを示している。

主要なLLMモデルの一般的なコーディングおよび数学ベンチマークにおけるパフォーマンス（提供：Mistral AI）

低遅延ワークロードに最適化された新しいMistral Small

　Mistral AIはMistral Largeと並行して、レイテンシとコストを最適化したモデル、「Mistral Small」もリリースした。同社によると、「Mistral Smallは『Mixtral 8x7B』（同社が2023年12月にリリースしたGPT3.5 と同等レベルのLLM）を超える性能を持ち、レイテンシが低いためオープンウェイトモデルとフラッグシップモデルの中間的なソリューションとして最適である」という。