NVIDIA、オープン世界基盤モデルやマルチモーダルRAGなどを発表:フィジカルAI、自動運転車開発も促進
NVIDIAは、AI活用を促進するための新たなオープンモデルや機能追加を発表した。オープン世界基盤モデルやフィジカルAI、自動運転車開発、ヘルスケア・ライフサイエンス向けの発表内容をまとめる。
NVIDIAは2026年1月6日(米国時間)、AI(人工知能)活用を促進するための新たなオープンモデルや機能追加を発表した。
- AIエージェントのマルチモーダルRAGと安全性などを強化する「NVIDIA Nemotron」
- オープン世界基盤モデル「NVIDIA Cosmos」
- フィジカルAIの実装向けオープンモデル「NVIDIA Isaac GR00T」
- 自動運転車開発向けの「NVIDIA Alpamayo」
- ヘルスケア・ライフサイエンス向けの「NVIDIA Clara」モデル群
NVIDIAは、オープンソースのトレーニングフレームワークに加え、オープンマルチモーダルデータコレクションを提供している。これには10兆個の言語トレーニングトークン、50万のロボット軌跡、45万5000件のタンパク質構造、100TB(テラバイト)に上る車両センサーデータが含まれる。
AIエージェントのマルチモーダルRAGと安全性などを強化する「NVIDIA Nemotron」
「NVIDIA Nemotron 3」ファミリーでは、音声モデルやマルチモーダルRAG(検索拡張生成)、安全性のためのオープンモデルをリリースする。
- 「Nemotron Speech」
リアルタイムで低遅延の自動音声認識(ASR)を実現するオープンモデル群。ベンチマークでは同クラスの他モデルと比較して10倍高速なパフォーマンスを発揮するという - 「Nemotron RAG」
埋め込みおよびリランキング(再ランク付け)機能を備えた視覚言語モデル(VLM)で構成される。多言語およびマルチモーダルなデータインサイトにより、情報検索を強化する - 「Nemotron Safety」
多言語対応の「Llama Nemotron Content Safety」モデルや、個人を特定できる情報(PII)を高精度に検出する「Nemotron PII」が含まれる
Boschはドライバーと車両のインタラクションにNemotron Speechを採用している。ServiceNowはオープンデータセットで「Apriel」モデルファミリーをトレーニングしている。CadenceやIBMは複雑な技術文書の検索向上のためにNemotron RAGを試験運用中だ。CrowdStrike、Cohesity、FortinetはAIアプリの信頼性強化にNemotron Safetyを採用している。
開発者向けに「Llama Embed Nemotron 8B」モデルのデータセットやトレーニングコード、AIリクエストを最適なモデルに誘導する「LLM Router」の更新版と「Nemotron Speech ASR」の構築に使用されたデータセットも公開された。
オープン世界基盤モデル「NVIDIA Cosmos」
フィジカルAIの開発に向け、複雑な現実環境を認識、リーズニング、行動できる現実世界を模した環境を生成する機能を備えた「NVIDIA Cosmos」世界基盤モデルをリリースする。
- 「Cosmos Reason 2」
ロボットやAIエージェントが現実世界を正確に認識し、インタラクションを行うためのリーズニングVLM - 「Cosmos Transfer 2.5」「Cosmos Predict 2.5」
多様な環境条件で大規模な合成ビデオを生成するモデル
SalesforceやMilestone Systems、日立製作所、Uber Technologies、VAST Data、Encordは、生産性向上のためのAIエージェントにCosmos Reasonを使用している。
フィジカルAIの実装向けオープンモデル「NVIDIA Isaac GR00T」
NVIDIAは、フィジカルAIの実装向けに、オープンモデルとブループリントも公開している。
- 「Isaac GR00T N1.6」
ヒューマノイドロボット向けに構築されたオープンなリーズニングVLA(視覚言語アクション)モデル。全身制御を可能にし、Cosmos Reasonを活用してコンテキスト理解を向上させる - 「NVIDIA Blueprint」
大量のビデオデータを分析する視覚AIエージェント構築のためのレファレンスワークフロー
Franka RoboticsやHumanoid、NEURA Roboticsは、Isaac GR00Tを活用してロボットの動作をシミュレーション、トレーニング、検証している。
自動運転車開発向けの「NVIDIA Alpamayo」
NVIDIAは、自動運転車(AV)の複雑な環境下でリーズニングに基づき行動するAIシステムの開発を推進するためにオープンモデルとツール、データセットを含む「NVIDIA Alpamayo」を公開した。
- 「Alpamayo 1」
自動運転車向けのオープンな大規模リーズニングVLAモデル。車両が周囲を理解し、自らの行動を説明することを可能にする - 「AlpaSim」
エッジケースにわたるリーズニングベースのAVモデルのクローズドループトレーニングと評価を可能にするオープンソースシミュレーションフレームワーク - 「Physical AI Open Dataset」
1700時間以上の走行データを含むデータセット。複雑な実世界のエッジケースを網羅している
ヘルスケア・ライフサイエンス向けの「NVIDIA Clara」モデル群
NVIDIAは、デジタルな発見と現実世界の医療をつなぐ「NVIDIA Clara」モデル群を発表した。研究者が安全で容易に製造できる治療法を設計できるよう支援する。
- 「La-Proteina」
原子レベルで精密な巨大タンパク質の設計を可能にし、疾患研究のためのツールを提供する - 「ReaSyn v2」
製造ブループリントを創薬プロセスに組み込み、AI設計による医薬品の合成を容易にする - 「KERMT」
候補薬と人体の相互作用を予測し、開発初期段階で計算安全性試験を提供する - 「RNAPro」
RNA(リボ核酸)分子の複雑な3D形状を予測する
AI研究者がより正確なモデルを構築するためのリソースとして、45万5000件の合成タンパク質構造からなるデータセットも提供する。
これらのオープンモデル、データ、フレームワークは、「GitHub」「Hugging Face」など、クラウドプラットフォームを通じて利用可能となっている。多くのモデルは「NVIDIA NIM(NVIDIA Inference Microservices)マイクロサービス」としても提供され、エッジからクラウドまで展開される「NVIDIAアクセラレーテッドインフラ」にスケーラブルに展開できるという。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
NVIDIA、「フィジカルAI」を支援するオープンモデルやフレームワークを発表
NVIDIAはフィジカルAI向けの新たなオープンモデルとフレームワークを発表した。併せて、Boston Dynamicsをはじめとするパートナー企業がこれらを活用した次世代ロボットやロボット運用を効率化している事例も発表された。
第308回 NVIDIAの一強は続くのか? 新プラットフォーム「Rubin」が描くエコシステムとDRAM危機の正体
NVIDIAが新プラットフォーム「Rubin」を発表。AI需要の爆発によりDRAM不足が深刻化し、PCやスマホの供給にも影響が出始めている。単なるチップから「エコシステム」へと進化し、ネットワークやストレージまでをも飲み込もうとするNVIDIAの戦略と、AIへの過度な投資が招く世界規模のリスクを考察する。
NVIDIA、日本語特化型のフルスクラッチ大言語モデルを提供開始
NVIDIAは、ストックマークが開発した1000億パラメーターの日本語大規模言語モデルを「NVIDIA NIMマイクロサービス」として提供開始した。
