検索
ニュース

Mistral AI、コーディング用生成AIモデル「Codestral」を提供開始 3万2000トークンのコンテキストウィンドウを持つ220億パラメーターモデル80以上のプログラミング言語のデータセットで学習

Mistral AIは、同社初のコーディングモデル「Codestral」を発表した。コード生成タスク用に設計され、重みが公開されている生成AIモデルだ。

Share
Tweet
LINE
Hatena

 Mistral AIは2024年5月29日(フランス時間)、同社初のコーディングモデル「Codestral」を発表した。

 Codestralはコード生成タスク用に設計され、重みが公開されている生成AI(人工知能)モデルだ。広く使われているPython、Java、C、C++、JavaScript、bashなど、80以上のプログラミング言語の多様なデータセットでトレーニングされている。SwiftやFortranのような特定の言語でも高いパフォーマンスを発揮する。

 Codestralはコーディング関数を完成させ、テストを作成し、FIM(Fill in the Middle)メカニズムを用いて部分的コードを記述できる。開発者にとって時間と労力の節約や、コーディングのレベルアップ、エラーやバグのリスク軽減に役立つとしている。

パフォーマンス比較

 Codestralは、32k(3万2000)トークンのコンテキストウィンドウを持つ22B(220億)パラメーターモデルだ。コンテキスト長がより短く、パラメーター数がより多い従来のコーディングモデルと、PythonコードとSQLコードに関するパフォーマンスを比較した結果、特にRepoBenchベンチマークで優れたパフォーマンスを発揮したという。

PythonおよびSQLコードに関するCodestralと競合モデルのパフォーマンス比較(提供:Mistral AI)
PythonおよびSQLコードに関するCodestralと競合モデルのパフォーマンス比較(提供:Mistral AI)

 Mistral AIは、他にも次の2つのパフォーマンス比較結果を紹介している。

Python、C++、bash、Java、PHP、TypeScript、C#コードに関するCodestralと競合モデルのパフォーマンス比較(提供:Mistral AI)
Python、C++、bash、Java、PHP、TypeScript、C#コードに関するCodestralと競合モデルのパフォーマンス比較(提供:Mistral AI)
Python、JavaScript、JavaコードのFIMタスクに関するCodestralと競合モデルのパフォーマンス比較(提供:Mistral AI)
Python、JavaScript、JavaコードのFIMタスクに関するCodestralと競合モデルのパフォーマンス比較(提供:Mistral AI)

Codestralを利用するには

 Codestralは、「Mistral AI Non-Production License」でライセンスされており、研究やテストの目的で使用できる(商用利用はできない)。Hugging Faceで公開されており、以下の方法で使用できる。

専用のAPIエンドポイントから

 Codestralのリリースに伴い、新しいAPIエンドポイントとして「codestral.mistral.ai」が追加された。これは、IDE(統合開発環境)でMistral AIのInstructまたはFill-In-the-Middleルートを使用するユーザー向けだ。8週間のβ期間中、無料で利用できるが、ウェイティングリストが設けられている。

「La Plateforme」で

 Mistral AIのインフラでホストされているアクセスポイント「La Plateforme」で通常のAPIエンドポイント「api.mistral.ai」から使用できる。クエリにトークン単位で課金される。研究、バッチクエリ、サードパーティーアプリケーション開発に適している。

「Le Chat」を介して

 無料の会話インタフェース「Le Chat」を介してCodestralと対話し、モデルの機能を使用できる。

お気に入りのコーディング/ビルド環境で

 Mistral AIとコミュニティーパートナーの協力により、Codestralは「LlamaIndex」や「LangChain」に統合されている。Codestralを使って簡単にエージェントアプリケーションを作成できる。「Visual Studio Code」や「JetBrains」でもCodestralを使用できる。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る