GPT-4に次ぐ性能? LLM「Mistral Large」が登場 Azureでも利用可能多言語対応、文化的背景理解に強み

Mistral AIがリリースしたLLM、Mistral Largeはテキスト理解、変換、コード生成などさまざまなタスクに活用できる。MistralはAzure AI Studioなどで利用できる。

» 2024年03月13日 08時00分 公開
[@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 フランスのAIスタートアップ企業であるMistral AIは、2024年2月26日(フランス時間)、大規模言語モデル(LLM)「Mistral Large」をリリースした。Mistral Largeは「Microsoft Azure」上で利用できる。低遅延ワークロードに対応したLLM、「Mistral Small」の提供も開始した。

Mistral AIのフラグシップモデル Mistral Large

 Mistral AIによると、Mistral Largeは高性能のテキスト生成モデルであり、高いレベルの推論能力を備えており、テキスト理解、変換、コード生成を含む複雑な多言語推論タスクに使用できるという。

 同社の発表では、Mistral Largeは標準的なベンチマークで高い結果を達成している。APIを通じて一般に利用可能なモデルとしては、GPT-4に次いで世界第2位と主張している。

MMLU(大規模マルチタスク言語理解を測るために設計されたベンチマーク)の比較(提供:Mistral AI)

Mistral Largeの機能と強み

 同社が主張するMistral Largeの機能と強みは以下の通り。

多言語対応と文化的背景の理解

 英語、フランス語、スペイン語、ドイツ語、イタリア語にネイティブに対応し、文法や文化的背景を理解できる。

3万2000トークンのコンテキストウィンドウ

 コンテキストウィンドウのトークン数が3万2000あるため、大きいサイズのドキュメントを理解できる。

指示や命令に対する正確な応答

 命令を正確に遂行する能力が高いため、開発者はモデレーションポリシーの設計が可能になる。

ネイティブで関数の呼び出しが可能

 関数呼び出しのネイティブサポートで、大規模で複雑なアプリケーションの開発や更新が効果的に行える。

Microsoftと提携し、Azure上でモデルを提供

 Mistral Largeは2024年3月時点、以下の方法で利用可能だ。

  1. La Plateforme:Mistral AIのインフラでホストされているアクセスポイント「La Plateforme」で、アプリケーションやサービスを作成できる
  2. Azure:「Azure AI Studio」と「Azure Machine Learning」でも利用できる
  3. セルフデプロイメント:開発者自身の環境にデプロイし、モデルの重み付けができる。これにより、センシティブな情報を扱うユースケースに対応できる。利用には、Mistral AIへの問い合わせが必要

Mistral Largeの性能

 一般的に使用されるベンチマークで、Mistral Largeの性能をトップクラスのLLMモデルと比較した結果は以下の通り。

推論と知識

 Mistral Largeは推論能力に強みを持っているという。「MMLU」(大規模マルチタスク言語理解を測るために設計されたベンチマーク)をはじめ、「HellaSwag」「WinoGrande」など7つのベンチマークでパフォーマンスを比較した結果を以下に示す。

LLMモデルの広範な常識、推論、知識ベンチマークにおけるパフォーマンス比較(提供:Mistral AI)

多言語対応

 Mistral Largeはフランス語、ドイツ語、スペイン語、イタリア語に対応している。

フランス語、ドイツ語、スペイン語、イタリア語でのパフォーマンス比較(提供:Mistral AI)

数学とコーディング

 Mistral Largeは、数学とコーディングのタスクで高いパフォーマンスを示している。

主要なLLMモデルの一般的なコーディングおよび数学ベンチマークにおけるパフォーマンス(提供:Mistral AI)

低遅延ワークロードに最適化された新しいMistral Small

 Mistral AIはMistral Largeと並行して、レイテンシとコストを最適化したモデル、「Mistral Small」もリリースした。同社によると、「Mistral Smallは『Mixtral 8x7B』(同社が2023年12月にリリースしたGPT3.5 と同等レベルのLLM)を超える性能を持ち、レイテンシが低いためオープンウェイトモデルとフラッグシップモデルの中間的なソリューションとして最適である」という。

JSONフォーマットと関数呼び出し

 「Mistral Large」と「Mistral Small」では、JSONフォーマットモードと関数呼び出し機能を利用できる。

 JSONフォーマットモードでは、言語モデルの出力が有効なJSONフォーマットになるように固定される。この機能により、開発者はより自然にモデルを操作して、開発パイプラインで簡単に使用できる構造化された形式で情報を抽出できるようになる。

 関数呼び出しは、独自のツールを使用してMistralのエンドポイントを操作できるようになる機能だ。これにより、内部コード、API、データベースとの複雑なインタラクションが可能になるという。

Copyright © ITmedia, Inc. All Rights Reserved.

スポンサーからのお知らせPR

注目のテーマ

Microsoft & Windows最前線2025
AI for エンジニアリング
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。