Metaは、次世代のオープンソース大規模言語モデル「Llama 2」を提供開始した。研究および商用に無料で利用できる。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
Metaは2023年7月18日(米国時間)、次世代のオープンソース大規模言語モデル(LLM)「Llama 2」の提供開始を発表した。研究および商用向けに無償で提供されている。
Llama 2は、同社が2023年2月に研究者向けに公開し、高い需要がある「Llama 1」の次期バージョン。開発者や組織が生成AIを活用したツールや体験を構築できるように設計されており、70億、130億、700億パラメーターの3つのサイズのモデルがある。
公開されているオンラインデータソースを用いて、Llama 1より40%多い2兆トークンで事前にトレーニングされており、コンテキスト長はLlama 1の2倍の4096トークンとなっている。
チャットやQ&Aなどの対話アプリケーション用に、これらをファインチューニングしたモデル(Llama-2-chat)も用意されている。これらは、公開されているインストラクションデータセットと、人間による100万以上のアノテーションでトレーニングすることで、有用性と安全性が確保されている。
Copyright © ITmedia, Inc. All Rights Reserved.