検索
ニュース

IBM、ビジネス向け高性能AIモデル「Granite 3.0」ファミリーを提供開始 RAGやエッジAIに適したモデルとは?Hugging Faceからダウンロードできる

IBMは、ビジネス向け高性能AIモデルファミリーの第3世代となる「Granite 3.0」を提供開始した。

Share
Tweet
LINE
Hatena

 IBMは2024年10月21日(米国時間)、ビジネス向け高性能AI(人工知能)モデルファミリーの第3世代となる「Granite 3.0」を提供開始した。

 Granite 3.0のフラグシップであり、汎用(はんよう)言語モデルの「Granite 3.0 8B」と「Granite 3.0 2B」は、多くの学術および業界ベンチマークにおいて、主要なモデルプロバイダー(Meta、Mistralなど)の同規模モデルを上回る、あるいは同等のパフォーマンスを発揮しているという。

RAGやエッジAIに適したモデルを複数公開、どんなモデルなのか?

 Granite 3.0ファミリーには、先述した2つのモデルをはじめ以下のモデルが含まれる。

汎用言語モデル

 汎用言語モデルである「Granite 3.0 8B Instruct」「Granite 3.0 2B Instruct」「Granite 3.0 8B Base」「Granite 3.0 2B Base」は、エンタープライズAI向けの主力モデルとして設計されており、検索拡張生成(RAG)、分類、要約、エンティティ抽出、ツール使用などのタスクに優れたパフォーマンスを発揮する。これらのコンパクトで多用途なモデルは、企業データでファインチューニングでき、さまざまなビジネス環境やワークフローにシームレスに統合できる。

ガードレール/安全性モデル

 ガードレール/安全性モデルである「Granite Guardian 3.0 8B」「Granite Guardian 3.0 2B」は、アプリケーション開発者がユーザーのプロンプトと大規模言語モデル(LLM)の応答のさまざまなリスクをチェックし、安全ガードレールを実装できるようにする。現在市場で提供されている中で最も包括的なリスクおよび有害性検出機能のセットを提供する。

Mixture-of-Expertsモデル

 Mixture-of-Expertsモデルである「Granite 3.0 3B-A800M Instruct」「Granite 3.0 1B-A400M Instruct」「Granite 3.0 3B-A800M Base」「Granite 3.0 1B-A400M Base」は、非常に効率的な推論と低レイテンシを実現し、CPUベースのデプロイ(展開)やエッジAIに適している。

透明性、安全性、信頼性

 IBMはAI製品における透明性、安全性、信頼性の構築に尽力しており、Granite 3.0の技術レポートと責任ある使用ガイドでは、Granite 3.0モデルのトレーニングに使用されたデータセットの説明、適用されたフィルタリング、クレンジング、キュレーションの各ステップの詳細、主要な学術および業界ベンチマークにおけるモデルパフォーマンスの包括的な結果が紹介されている。

 さらにIBMは、同社の「watsonx.ai」(AIアプリケーション開発のためのワンストップの統合AIプラットフォーム)上の全てのGraniteモデルについて、知的財産に関する補償を提供している。このため、企業顧客は自信を持ってデータとモデルを統合できる。

「Granite Time Series」モデル

 IBMは、2024年に最初のバージョンをリリースした事前トレーニング済みの「Granite Time Series」モデルの最新リリースも発表した。最新モデルは、最初のバージョンの3倍以上のデータでトレーニングされており、ゼロショット/少数ショット予測において、GoogleやAlibabaなどの10倍以上の規模のモデルを上回る最先端のパフォーマンスを達成したという。また、外部変数やローリング予測のサポートにより、より柔軟なモデリングも実現している。

Graniteモデルの入手方法

 Granite 3.0ファミリーの全モデルと最新のGranite Time Seriesモデルは、Hugging Faceからダウンロードできる。ライセンスはApache License 2.0となっている。Granite 3.0 8B Instruct、Granite 3.0 2B Instruct、Granite 3.0 8B Base、Granite 3.0 2B Baseは、IBMのAIおよびデータプラットフォームである「IBM watsonx」上で商業利用も可能だ。Granite 3.0モデルの一部は「NVIDIA NIMマイクロサービス」や、Google Cloudの「Vertex AI Model Garden」との統合を通じて提供される。

 IBMは、アプリケーション開発者のために選択肢を広げ、使いやすさを高め、ローカルやエッジでの展開をサポートするため、Granite 3.0モデルの一部を「Ollama」と「Replicate」でも利用できるようにしている。Ollamaは、LLMをローカルで実行するためのアプリケーション。Replicateは、AIモデルを手軽に実行できるクラウドプラットフォームだ。

 IBMは、AWS(Amazon Web Services)、Docker、Domo、Qualcomm Technologies(Qualcomm AI Hub)、Salesforce、SAPなどのエコシステムパートナーと協力し、Graniteモデルをこれらのパートナーのサービスに統合したり、これらのパートナーのプラットフォームで利用できるようにしたりすることで、企業に幅広い選択肢を提供している。

AIアシスタントやツールを拡充

 IBMは、Graniteのコーディングモデルをベースにした次世代の「watsonx Code Assistant」を、2024年第4四半期に提供開始する計画も発表した。次世代watsonx Code Assistantは、C、C++、Go、Java、Pythonなどの言語の汎用コーディング支援に加え、エンタープライズJavaアプリケーション向けの高度なモダナイゼーション機能を提供する。Graniteのコーディング機能は、「Visual Studio Code」のIBM Granite.Code拡張機能を通じて利用することもできる。

 さらにIBMはwatsonx.aiで、アプリケーション開発者がAIをより効率的に構築、カスタマイズ、展開するための新しいツールを、2024年第4四半期に提供開始する計画だ。このツールは、エージェントフレームワーク、既存環境との統合、RAGやエージェントのような一般的なユースケースに対応するローコード開発の自動化機能などを提供する。

 IBMは、より高い自律性、洗練された推論、多段階の問題解決を可能にするAIエージェント技術の開発を推進している。Granite 3.0 8Bモデルの初期リリースがサポートする主要なエージェント機能には、高度な推論の他、ツール使用のワークフローを実装するための高度に構造化されたチャットテンプレートやプロンプトスタイルなどがある。

Graniteが「IBM Consulting Advantage」の既定プラットフォームに

 IBMは、AIを本格活用するための柔軟で安全なプラットフォームを提供するソリューション「IBM Consulting Advantage」の大幅な拡張も発表した。この拡張の一環として、Granite 3.0の言語モデルが、Consulting Advantageの既定モデルとなる。Graniteのパフォーマンスと効率性を生かし、顧客の生成AIプロジェクトの投資収益率を向上させるとしている。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る