Mistral AIは、同社初のコーディングモデル「Codestral」を発表した。コード生成タスク用に設計され、重みが公開されている生成AIモデルだ。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
Mistral AIは2024年5月29日(フランス時間)、同社初のコーディングモデル「Codestral」を発表した。
Codestralはコード生成タスク用に設計され、重みが公開されている生成AI(人工知能)モデルだ。広く使われているPython、Java、C、C++、JavaScript、bashなど、80以上のプログラミング言語の多様なデータセットでトレーニングされている。SwiftやFortranのような特定の言語でも高いパフォーマンスを発揮する。
Codestralはコーディング関数を完成させ、テストを作成し、FIM(Fill in the Middle)メカニズムを用いて部分的コードを記述できる。開発者にとって時間と労力の節約や、コーディングのレベルアップ、エラーやバグのリスク軽減に役立つとしている。
Codestralは、32k(3万2000)トークンのコンテキストウィンドウを持つ22B(220億)パラメーターモデルだ。コンテキスト長がより短く、パラメーター数がより多い従来のコーディングモデルと、PythonコードとSQLコードに関するパフォーマンスを比較した結果、特にRepoBenchベンチマークで優れたパフォーマンスを発揮したという。
Mistral AIは、他にも次の2つのパフォーマンス比較結果を紹介している。
Codestralは、「Mistral AI Non-Production License」でライセンスされており、研究やテストの目的で使用できる(商用利用はできない)。Hugging Faceで公開されており、以下の方法で使用できる。
Codestralのリリースに伴い、新しいAPIエンドポイントとして「codestral.mistral.ai」が追加された。これは、IDE(統合開発環境)でMistral AIのInstructまたはFill-In-the-Middleルートを使用するユーザー向けだ。8週間のβ期間中、無料で利用できるが、ウェイティングリストが設けられている。
Mistral AIのインフラでホストされているアクセスポイント「La Plateforme」で通常のAPIエンドポイント「api.mistral.ai」から使用できる。クエリにトークン単位で課金される。研究、バッチクエリ、サードパーティーアプリケーション開発に適している。
無料の会話インタフェース「Le Chat」を介してCodestralと対話し、モデルの機能を使用できる。
Mistral AIとコミュニティーパートナーの協力により、Codestralは「LlamaIndex」や「LangChain」に統合されている。Codestralを使って簡単にエージェントアプリケーションを作成できる。「Visual Studio Code」や「JetBrains」でもCodestralを使用できる。
Copyright © ITmedia, Inc. All Rights Reserved.