検索
ニュース

IBM、生成AIモデル「Granite」ファミリーをオープンソース化 116のプログラミング言語に対応するモデルを公開Python、JavaScript、Java、Go、C++、Rustなど主要なプログラミング言語に対応

IBMは、同社が開発した生成AIモデル「Granite」において、Granite CodeモデルとGranite Code Instructモデルの2つをオープンソース化した。コード生成、バグ修正、コードの説明など、さまざまなプログラミングタスクに特化したモデルだという。

Share
Tweet
LINE
Hatena

 IBMは2024年5月7日(米国時間)、同社が開発した生成AI(人工知能)モデル「Granite」ファミリーにおいてコーディングタスクに特化した「Granite Codeモデル」と、指示学習(インストラクションチューニング)済みの「Granite Code Instructモデル」をオープンソース化したと発表した。これらのモデルはApache License 2.0でリリースされている。

 IBMは、これらのモデルをオープンソースで公開した背景を、次のように述べている。

 「生成AIの人気が急上昇する一方、企業での採用は遅れている。その理由の一つは、コストが高いことだ。多くのモデルは数百億のパラメーターを持っており、汎用(はんよう)的なチャットbotを構築するには有用だが、推論と実行に多くの計算リソースが必要となる。コスト以外にも、大規模言語モデル(LLM)のライセンスが不明確であることや、モデルの学習方法、データの不透明性が理由として挙げられる。IBMは、オープンイノベーションの力を信じている。コーディングが、いつでも利用できるアシスタントとの会話のように簡単になる未来を目指して、できるだけ多くの開発者に利用してもらいたいと考えている。効果的なシステムは一人の力ではなく、多くの人々の知識を集めて作られるものだからだ」

モデルの特徴

 IBMがリリースしたモデルの特徴は次の通り。

  • Granite Codeモデル:Granite Codeモデルは116のプログラミング言語で記述されたコードを学習させているLLMだ。複雑なアプリケーションのモダナイゼーションタスクからメモリ容量が限られたデバイスでの使用まで幅広いコード生成タスクに対応している
  • Granite Code Instructモデル:人間の指示を組み合わせたGitコミットと、オープンソースのデータセットを使用して指示学習されたLLMだ。コードの修正や説明、リポジトリ管理など、特定のタスクに最適化している

 30億、80億、200億、340億のパラメーターサイズがあり、「Hugging Face」「GitHub」「watsonx.ai」「Red Hat Enterprise Linux AI」を通じてこれらのモデルを利用できる。IBMによると、同社のAI倫理原則に従い、法務チームによる指導の下で収集されたデータを学習に使用しているという。

モデルのパフォーマンス

 IBMは「Python、JavaScript、Java、Go、C++、Rustなど主要なプログラミング言語でのコード生成、修正、説明、編集、置換において強力な性能を示している」と述べている。

ベンチマークデータセット「HumanEvalPack」を用いたGranite Codeモデルのパフォーマンス比較(提供:IBM)
ベンチマークデータセット「HumanEvalPack」を用いたGranite Codeモデルのパフォーマンス比較(提供:IBM)

モデルのユースケース

 IBMは、企業におけるモデルのユースケースとして、次のような例を挙げている。

  • 開発者のためにコードを生成するエージェント
  • コードが動作しない理由や修正方法を説明するツール
  • ユニットテストの生成
  • ドキュメント作成
  • 脆弱(ぜいじゃく)性テストの実行
  • ミッションクリティカルなアプリケーションのモダナイゼーション
  • COBOLのようなレガシーコードをJavaのような現代的な言語に置換

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る