ニュース
Meta、商用利用可能なオープンソースLLM「Llama 2」を提供開始 「MPT」や「Falcon」を上回る成績:MicrosoftがLlama 2の優先パートナーに
Metaは、次世代のオープンソース大規模言語モデル「Llama 2」を提供開始した。研究および商用に無料で利用できる。
Metaは2023年7月18日(米国時間)、次世代のオープンソース大規模言語モデル(LLM)「Llama 2」の提供開始を発表した。研究および商用向けに無償で提供されている。
Llama 2は、同社が2023年2月に研究者向けに公開し、高い需要がある「Llama 1」の次期バージョン。開発者や組織が生成AIを活用したツールや体験を構築できるように設計されており、70億、130億、700億パラメーターの3つのサイズのモデルがある。
公開されているオンラインデータソースを用いて、Llama 1より40%多い2兆トークンで事前にトレーニングされており、コンテキスト長はLlama 1の2倍の4096トークンとなっている。
チャットやQ&Aなどの対話アプリケーション用に、これらをファインチューニングしたモデル(Llama-2-chat)も用意されている。これらは、公開されているインストラクションデータセットと、人間による100万以上のアノテーションでトレーニングすることで、有用性と安全性が確保されている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 大規模なインフラを自由に使えないAI研究者向けに、Metaが「小規模で高性能な言語モデル」を公開
Metaは、同社開発した言語モデル「LLaMA」(Large Language Model Meta AI)を研究者向けに公開した。「人間の文章生成に似た方法で文章を生成できる」という。 - 軽量動作も可能なオープンソースの大規模言語モデル「Falcon」が登場
UAEのTechnology Innovation Instituteは、Apache-2.0ライセンスの下でリリースした言語モデル「Falcon」について公式ブログで紹介した。 - OpenAI、LLMの「GPT-4」および「GPT-3.5」ファミリーの最新モデルをリリース 関数呼び出しなど可能に
OpenAIは、大規模言語モデル(LLM)の「GPT-4」および「GPT-3.5」ファミリーの最新モデルをリリースし、「Chat Completions API」への関数呼び出し機能の追加などのアップデートを紹介した。