Red Hatが誰でもLLM開発に貢献できるオープンソースプロジェクト、「InstructLab」を発表Red Hat Summit 2024

Red HatがオープンソースLLMをさらにオープンソース化するプロジェクト、「InstructLab」を開始した。誰でもLLM開発に参加することができ、「生成AIの未来をともに形作れる」と訴えている。まずIBM Researchの「Granite」モデルなどから始める。

» 2024年05月08日 09時00分 公開
[三木泉@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 Red Hatは2024年5月7日(米国時間)、オープンソースプロジェクトのやり方を大規模言語モデル(LLM)開発に取り込んだプロジェクト、「InstructLab」を同社の年次イベント「Red Hat Summit 2024」で発表した。インストラクションチューニングを取り入れる。

 「オープンなモデルは多数存在するが、オープンソースではないか、利用に制限がある。これが大きな課題となっている」と、Red Hatのシニアバイスプレジデントで最高製品責任者(CPO)のアシシュ・バダーニ氏は説明する。

 「企業が特定のユースケースで本当に機能するモデルを作成するためには、社内データによるファインチューニングを考える前に、モデルがどのように学習されたのか、何を使って学習されたのか、誰がモデルにコントリビューションしたのかなど、モデルの全体像を理解する必要がある」

 利用組織が自らの目的のためにチューニングを行えばフォークすることになり、他の誰もコントリビューションできなくなってしまう。この問題を解消するために、Pull Requestという形で誰もがLLM開発にコントリビューションできる場を作るのだという。

 なお、「InstructLab」というプロジェクト名は、「Large-Scale Alignment for ChatBots」というLLMのインストラクションチューニングをスケールする手法から命名されている。

 今回のプロジェクトは、Red Hatが今回IBM ResearchとともにオープンソースとしてリリースしたLLM、「Granite-7b」「Merlinite 7b」でスタートした。コントリビューションは毎週モデルに取り込まれるという。

 では、誰が何をコントリビューションできるのか。

 コントリビューションできる内容は“スキル”と“ナレッジ”だという。

 スキルでは、文字通りLLMにスキルを教える。下の例では、英語での韻の踏み方を教えている。YAMLファイルの形でコントリビューションする。

スキルの例

 ナレッジは、(こちらも文字通りだが)質問と回答という形式で、LLMに知識を教える。下の例では2024年のオスカー賞についての質問と回答をコントリビューションしている。

 なお、コントリビューションできるナレッジは、現在のところWikipediaに掲載されている情報に限っている。

ナレッジの例

 小サイズのYAMLファイルを提供すればいいため、コントリビューターはソフトウェア開発者やデータサイエンティストでなくて構わない。ビジネスパーソンや何らかの分野の専門家、組織など、誰もがLLM開発に参加できるとRed Hatは強調している。

Copyright © ITmedia, Inc. All Rights Reserved.

スポンサーからのお知らせPR

注目のテーマ

4AI by @IT - AIを作り、動かし、守り、生かす
Microsoft & Windows最前線2025
AI for エンジニアリング
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。