コードと自然言語のプロンプトからコードとコード関連の自然言語を生成する「Code Llama」の高性能バージョン「Code Llama 70B」がリリースされた。高いパフォーマンスを示しており、ベンチマークテストでも他のLLMをしのぐという。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
Metaは2024年1月29日(米国時間)、テキストプロンプトを使用してコードを生成する大規模言語モデル(LLM)、「Code Llama」の高性能バージョン、「Code Llama 70B」をリリースした。Code Llamaは2023年8月24日(米国時間)に同社が発表した、プログラミングなどで利用可能な最新技術の言語モデルだ。開発者は迅速かつ効率的に作業を進めることができ、プログラミング学習者にとっても参入のハードルを下げ、プログラミングをより効果的に学ぶための教育ツールとしても利用できる。
今回追加されたCode Llama 70Bは、Code Llamaファミリーの中で最大かつ最高のパフォーマンスを発揮するという。Code Llama 70Bの詳細は次の通り。
2023年8月に公開されたCode Llamaの詳細は次の通り。
Code Llamaは、Llama 2をコードデータセットで訓練し、コーディング能力を強化して作成された。Code Llamaは、コードと自然言語のプロンプトの両方に基づいて、コードとコードに関する自然言語を生成することができる。Python、「C++」「Java」「PHP」「Typescript」「JavaScript」「C#」「Bash」などの一般的なプログラミング言語をサポートしている。
Code Llamaには、今回追加された70Bを含め、さまざまなパラメーター(7B、13B、34B、70B)を持つ4つのサイズがある。これらのモデルは、さまざまな量のコード関連データで学習され、それぞれ異なるサービング要件とレイテンシ要件に対応している。7Bと13Bのモデルは、既存のコードに新しいコードを挿入できるfill-in-the-middle(FIM)機能を備えており、コードの途中に新しいコードを挿入して、コードの補完などのタスクを直ちにサポートできる。34Bと70Bの大型モデルは、より優れたコーディング支援を提供するが、小型モデルはより高速で、リアルタイムのコード補完のような低レイテンシのタスクに適している。
Code Llamaのパフォーマンスをテストするために、「HumanEval」「Mostly Basic Python Programming」(MBPP)という2つの一般的なコーディングベンチマークを使用し、既存のLLMと比較した。HumanEvalは、docstringに基づいてコードを完成させるモデルの能力をテストし、MBPPは、記述に基づいてコードを記述するモデルの能力をテストする。
Code Llamaはオープンソースの主要なコーディング用LLMよりも優れた性能を発揮し、Llama 2を上回った。例えば、Code Llama 34Bは、HumanEvalで53.7%、MBPPで56.2%と、他の最先端のオープンなソリューションと比較して最も高く、ChatGPTと同等だったという。
Copyright © ITmedia, Inc. All Rights Reserved.