Metaは2023年8月24日(米国時間)、7月に公開した大規模言語モデル(LLM)「Llama 2」をベースにしたコーディング用LLMファミリー「Code Llama」の提供開始を発表した。コーディングタスクにおいて、公開されているLLMの中で最先端のパフォーマンスを提供するとしている。

Code Llamaは、ベースモデルのCode Llama、Pythonに特化した「Code Llama - Python」、自然言語の命令を理解するようにファインチューニングされた「Code Llama - Instruct」の3種類があり、いずれも70億、130億、340億のパラメーターを持つ3サイズのモデルがある(以下では、それぞれ7Bモデル、13Bモデル、34Bモデルと表記する)。

Llama 2と同じコミュニティーライセンスで研究および商用向けに無償で提供されている。

Code Llama(提供:Meta)

Code Llamaは、Llama 2をコードに特化したデータセットでトレーニングして構築された。コードと自然言語の両方のプロンプト(例えば、「Write me a function that outputs the fibonacci sequence.:フィボナッチ数列を出力する関数を書いてください」など)から、コードとコードに関する自然言語を生成できる。コード補完やデバッグに使うことも可能だ。Python、C++、Java、PHP、TypeScript(JavaScript)、C#、Bashなど、現在使われている多くの一般的なプログラミング言語をサポートしている。

