IBM、生成AIモデル「Granite」ファミリーをオープンソース化 116のプログラミング言語に対応するモデルを公開:Python、JavaScript、Java、Go、C++、Rustなど主要なプログラミング言語に対応
IBMは、同社が開発した生成AIモデル「Granite」において、Granite CodeモデルとGranite Code Instructモデルの2つをオープンソース化した。コード生成、バグ修正、コードの説明など、さまざまなプログラミングタスクに特化したモデルだという。
IBMは2024年5月7日(米国時間)、同社が開発した生成AI(人工知能)モデル「Granite」ファミリーにおいてコーディングタスクに特化した「Granite Codeモデル」と、指示学習(インストラクションチューニング)済みの「Granite Code Instructモデル」をオープンソース化したと発表した。これらのモデルはApache License 2.0でリリースされている。
IBMは、これらのモデルをオープンソースで公開した背景を、次のように述べている。
「生成AIの人気が急上昇する一方、企業での採用は遅れている。その理由の一つは、コストが高いことだ。多くのモデルは数百億のパラメーターを持っており、汎用(はんよう)的なチャットbotを構築するには有用だが、推論と実行に多くの計算リソースが必要となる。コスト以外にも、大規模言語モデル(LLM)のライセンスが不明確であることや、モデルの学習方法、データの不透明性が理由として挙げられる。IBMは、オープンイノベーションの力を信じている。コーディングが、いつでも利用できるアシスタントとの会話のように簡単になる未来を目指して、できるだけ多くの開発者に利用してもらいたいと考えている。効果的なシステムは一人の力ではなく、多くの人々の知識を集めて作られるものだからだ」
モデルの特徴
IBMがリリースしたモデルの特徴は次の通り。
- Granite Codeモデル:Granite Codeモデルは116のプログラミング言語で記述されたコードを学習させているLLMだ。複雑なアプリケーションのモダナイゼーションタスクからメモリ容量が限られたデバイスでの使用まで幅広いコード生成タスクに対応している
- Granite Code Instructモデル:人間の指示を組み合わせたGitコミットと、オープンソースのデータセットを使用して指示学習されたLLMだ。コードの修正や説明、リポジトリ管理など、特定のタスクに最適化している
30億、80億、200億、340億のパラメーターサイズがあり、「Hugging Face」「GitHub」「watsonx.ai」「Red Hat Enterprise Linux AI」を通じてこれらのモデルを利用できる。IBMによると、同社のAI倫理原則に従い、法務チームによる指導の下で収集されたデータを学習に使用しているという。
モデルのパフォーマンス
IBMは「Python、JavaScript、Java、Go、C++、Rustなど主要なプログラミング言語でのコード生成、修正、説明、編集、置換において強力な性能を示している」と述べている。
モデルのユースケース
IBMは、企業におけるモデルのユースケースとして、次のような例を挙げている。
- 開発者のためにコードを生成するエージェント
- コードが動作しない理由や修正方法を説明するツール
- ユニットテストの生成
- ドキュメント作成
- 脆弱(ぜいじゃく)性テストの実行
- ミッションクリティカルなアプリケーションのモダナイゼーション
- COBOLのようなレガシーコードをJavaのような現代的な言語に置換
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- IBM、エンタープライズ向け生成AI「watsonx Granite」のモデルが一般利用開始に
IBMは、生成AIモデルのコレクションである「watsonx Granite」シリーズの最初のモデル群を一般提供すると発表した。 - Red Hatが誰でもLLM開発に貢献できるオープンソースプロジェクト、「InstructLab」を発表
Red HatがオープンソースLLMをさらにオープンソース化するプロジェクト、「InstructLab」を開始した。誰でもLLM開発に参加することができ、「生成AIの未来をともに形作れる」と訴えている。まずIBM Researchの「Granite」モデルなどから始める。 - Meta、次世代オープンLLM「Meta Llama 3」を発表
Metaは、大規模言語モデル「Meta Llama 3」の8Bおよび70Bパラメーターモデルを発表した。