GPT-4に次ぐ性能？　LLM「Mistral Large」が登場　Azureでも利用可能：多言語対応、文化的背景理解に強み

Mistral AIがリリースしたLLM、Mistral Largeはテキスト理解、変換、コード生成などさまざまなタスクに活用できる。MistralはAzure AI Studioなどで利用できる。

[＠IT] PC用表示関連情報

LINE

Hatena

　フランスのAIスタートアップ企業であるMistral AIは、2024年2月26日（フランス時間）、大規模言語モデル（LLM）「Mistral Large」をリリースした。Mistral Largeは「Microsoft Azure」上で利用できる。低遅延ワークロードに対応したLLM、「Mistral Small」の提供も開始した。

Mistral AIのフラグシップモデル Mistral Large

　Mistral AIによると、Mistral Largeは高性能のテキスト生成モデルであり、高いレベルの推論能力を備えており、テキスト理解、変換、コード生成を含む複雑な多言語推論タスクに使用できるという。

　同社の発表では、Mistral Largeは標準的なベンチマークで高い結果を達成している。APIを通じて一般に利用可能なモデルとしては、GPT-4に次いで世界第2位と主張している。

MMLU（大規模マルチタスク言語理解を測るために設計されたベンチマーク）の比較（提供：Mistral AI）

Mistral Largeの機能と強み

　同社が主張するMistral Largeの機能と強みは以下の通り。

多言語対応と文化的背景の理解

　英語、フランス語、スペイン語、ドイツ語、イタリア語にネイティブに対応し、文法や文化的背景を理解できる。

3万2000トークンのコンテキストウィンドウ

　コンテキストウィンドウのトークン数が3万2000あるため、大きいサイズのドキュメントを理解できる。

指示や命令に対する正確な応答

　命令を正確に遂行する能力が高いため、開発者はモデレーションポリシーの設計が可能になる。

ネイティブで関数の呼び出しが可能

　関数呼び出しのネイティブサポートで、大規模で複雑なアプリケーションの開発や更新が効果的に行える。

Microsoftと提携し、Azure上でモデルを提供

　Mistral Largeは2024年3月時点、以下の方法で利用可能だ。

La Plateforme：Mistral AIのインフラでホストされているアクセスポイント「La Plateforme」で、アプリケーションやサービスを作成できる
Azure：「Azure AI Studio」と「Azure Machine Learning」でも利用できる
セルフデプロイメント：開発者自身の環境にデプロイし、モデルの重み付けができる。これにより、センシティブな情報を扱うユースケースに対応できる。利用には、Mistral AIへの問い合わせが必要

Mistral Largeの性能

　一般的に使用されるベンチマークで、Mistral Largeの性能をトップクラスのLLMモデルと比較した結果は以下の通り。

推論と知識

　Mistral Largeは推論能力に強みを持っているという。「MMLU」（大規模マルチタスク言語理解を測るために設計されたベンチマーク）をはじめ、「HellaSwag」「WinoGrande」など7つのベンチマークでパフォーマンスを比較した結果を以下に示す。

LLMモデルの広範な常識、推論、知識ベンチマークにおけるパフォーマンス比較（提供：Mistral AI）

多言語対応

　Mistral Largeはフランス語、ドイツ語、スペイン語、イタリア語に対応している。

フランス語、ドイツ語、スペイン語、イタリア語でのパフォーマンス比較（提供：Mistral AI）

数学とコーディング

　Mistral Largeは、数学とコーディングのタスクで高いパフォーマンスを示している。

主要なLLMモデルの一般的なコーディングおよび数学ベンチマークにおけるパフォーマンス（提供：Mistral AI）

低遅延ワークロードに最適化された新しいMistral Small

　Mistral AIはMistral Largeと並行して、レイテンシとコストを最適化したモデル、「Mistral Small」もリリースした。同社によると、「Mistral Smallは『Mixtral 8x7B』（同社が2023年12月にリリースしたGPT3.5 と同等レベルのLLM）を超える性能を持ち、レイテンシが低いためオープンウェイトモデルとフラッグシップモデルの中間的なソリューションとして最適である」という。

JSONフォーマットと関数呼び出し

　「Mistral Large」と「Mistral Small」では、JSONフォーマットモードと関数呼び出し機能を利用できる。

　JSONフォーマットモードでは、言語モデルの出力が有効なJSONフォーマットになるように固定される。この機能により、開発者はより自然にモデルを操作して、開発パイプラインで簡単に使用できる構造化された形式で情報を抽出できるようになる。

　関数呼び出しは、独自のツールを使用してMistralのエンドポイントを操作できるようになる機能だ。これにより、内部コード、API、データベースとの複雑なインタラクションが可能になるという。

GPT-4に次ぐ性能？　LLM「Mistral Large」が登場　Azureでも利用可能：多言語対応、文化的背景理解に強み

Mistral AIのフラグシップモデル Mistral Large