NVIDIA、オープン世界基盤モデルやマルチモーダルRAGなどを発表フィジカルAI、自動運転車開発も促進

NVIDIAは、AI活用を促進するための新たなオープンモデルや機能追加を発表した。オープン世界基盤モデルやフィジカルAI、自動運転車開発、ヘルスケア・ライフサイエンス向けの発表内容をまとめる。

» 2026年01月28日 13時00分 公開
[@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 NVIDIAは2026年1月6日(米国時間)、AI(人工知能)活用を促進するための新たなオープンモデルや機能追加を発表した。

  • AIエージェントのマルチモーダルRAGと安全性などを強化する「NVIDIA Nemotron」
  • オープン世界基盤モデル「NVIDIA Cosmos」
  • フィジカルAIの実装向けオープンモデル「NVIDIA Isaac GR00T」
  • 自動運転車開発向けの「NVIDIA Alpamayo」
  • ヘルスケア・ライフサイエンス向けの「NVIDIA Clara」モデル群

 NVIDIAは、オープンソースのトレーニングフレームワークに加え、オープンマルチモーダルデータコレクションを提供している。これには10兆個の言語トレーニングトークン、50万のロボット軌跡、45万5000件のタンパク質構造、100TB(テラバイト)に上る車両センサーデータが含まれる。

AIエージェントのマルチモーダルRAGと安全性などを強化する「NVIDIA Nemotron」

 「NVIDIA Nemotron 3」ファミリーでは、音声モデルやマルチモーダルRAG(検索拡張生成)、安全性のためのオープンモデルをリリースする。

  • 「Nemotron Speech」
    リアルタイムで低遅延の自動音声認識(ASR)を実現するオープンモデル群。ベンチマークでは同クラスの他モデルと比較して10倍高速なパフォーマンスを発揮するという
  • 「Nemotron RAG」
    埋め込みおよびリランキング(再ランク付け)機能を備えた視覚言語モデル(VLM)で構成される。多言語およびマルチモーダルなデータインサイトにより、情報検索を強化する
  • 「Nemotron Safety」
    多言語対応の「Llama Nemotron Content Safety」モデルや、個人を特定できる情報(PII)を高精度に検出する「Nemotron PII」が含まれる

 Boschはドライバーと車両のインタラクションにNemotron Speechを採用している。ServiceNowはオープンデータセットで「Apriel」モデルファミリーをトレーニングしている。CadenceやIBMは複雑な技術文書の検索向上のためにNemotron RAGを試験運用中だ。CrowdStrike、Cohesity、FortinetはAIアプリの信頼性強化にNemotron Safetyを採用している。

 開発者向けに「Llama Embed Nemotron 8B」モデルのデータセットやトレーニングコード、AIリクエストを最適なモデルに誘導する「LLM Router」の更新版と「Nemotron Speech ASR」の構築に使用されたデータセットも公開された。

オープン世界基盤モデル「NVIDIA Cosmos」

 フィジカルAIの開発に向け、複雑な現実環境を認識、リーズニング、行動できる現実世界を模した環境を生成する機能を備えた「NVIDIA Cosmos」世界基盤モデルをリリースする。

  • 「Cosmos Reason 2」
    ロボットやAIエージェントが現実世界を正確に認識し、インタラクションを行うためのリーズニングVLM
  • 「Cosmos Transfer 2.5」「Cosmos Predict 2.5」
    多様な環境条件で大規模な合成ビデオを生成するモデル

 SalesforceやMilestone Systems、日立製作所、Uber Technologies、VAST Data、Encordは、生産性向上のためのAIエージェントにCosmos Reasonを使用している。

フィジカルAIの実装向けオープンモデル「NVIDIA Isaac GR00T」

 NVIDIAは、フィジカルAIの実装向けに、オープンモデルとブループリントも公開している。

  • 「Isaac GR00T N1.6」
    ヒューマノイドロボット向けに構築されたオープンなリーズニングVLA(視覚言語アクション)モデル。全身制御を可能にし、Cosmos Reasonを活用してコンテキスト理解を向上させる
  • 「NVIDIA Blueprint」
    大量のビデオデータを分析する視覚AIエージェント構築のためのレファレンスワークフロー

 Franka RoboticsやHumanoid、NEURA Roboticsは、Isaac GR00Tを活用してロボットの動作をシミュレーション、トレーニング、検証している。

自動運転車開発向けの「NVIDIA Alpamayo」

 NVIDIAは、自動運転車(AV)の複雑な環境下でリーズニングに基づき行動するAIシステムの開発を推進するためにオープンモデルとツール、データセットを含む「NVIDIA Alpamayo」を公開した。

  • 「Alpamayo 1」
    自動運転車向けのオープンな大規模リーズニングVLAモデル。車両が周囲を理解し、自らの行動を説明することを可能にする
  • 「AlpaSim」
    エッジケースにわたるリーズニングベースのAVモデルのクローズドループトレーニングと評価を可能にするオープンソースシミュレーションフレームワーク
  • 「Physical AI Open Dataset」
    1700時間以上の走行データを含むデータセット。複雑な実世界のエッジケースを網羅している

ヘルスケア・ライフサイエンス向けの「NVIDIA Clara」モデル群

 NVIDIAは、デジタルな発見と現実世界の医療をつなぐ「NVIDIA Clara」モデル群を発表した。研究者が安全で容易に製造できる治療法を設計できるよう支援する。

  • 「La-Proteina」
    原子レベルで精密な巨大タンパク質の設計を可能にし、疾患研究のためのツールを提供する
  • 「ReaSyn v2」
    製造ブループリントを創薬プロセスに組み込み、AI設計による医薬品の合成を容易にする
  • 「KERMT」
    候補薬と人体の相互作用を予測し、開発初期段階で計算安全性試験を提供する
  • 「RNAPro」
    RNA(リボ核酸)分子の複雑な3D形状を予測する

 AI研究者がより正確なモデルを構築するためのリソースとして、45万5000件の合成タンパク質構造からなるデータセットも提供する。

 これらのオープンモデル、データ、フレームワークは、「GitHub」「Hugging Face」など、クラウドプラットフォームを通じて利用可能となっている。多くのモデルは「NVIDIA NIM(NVIDIA Inference Microservices)マイクロサービス」としても提供され、エッジからクラウドまで展開される「NVIDIAアクセラレーテッドインフラ」にスケーラブルに展開できるという。

Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ

スポンサーからのお知らせPR

注目のテーマ

Microsoft & Windows最前線2026
人に頼れない今こそ、本音で語るセキュリティ「モダナイズ」
4AI by @IT - AIを作り、動かし、守り、生かす
AI for エンジニアリング
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。