検索
ニュース

NVIDIA、新GPU「Rubin CPX」発表 数百万トークン規模のAI処理を可能に「RTXが起こした革命の再来」とCEOが強調

NVIDIAは大規模コンテキストを処理するAI用の新GPU「Rubin CPX」を発表した。数百万トークン規模の処理を可能にし、コード生成や映像処理の分野で画期的な性能を実現するという。

Share
Tweet
LINE
Hatena

 NVIDIAは2025年9月9日(米国時間)、新GPU「Rubin CPX」を発表した。膨大な情報を一度に扱うAI(人工知能)処理に特化しており、開発プロジェクト全体で数百万トークンに及ぶコードを読み込んでコーディングをしたり、長時間の動画を生成したりといったタスクを高速化する。

画像
リリース

大規模コンテキストを扱うAIに特化したGPU

 Rubin CPXは、NVIDIAが発表した新システム「NVIDIA Vera Rubin NVL144 CPX」内で動作する。NVIDIA Vera Rubin NVL144 CPXは、大量のNVIDIA製CPUとGPUを1つのラックに集約し、大規模コンテキスト推論や長文処理に最適化されたAI特化型コンピューティングシステムだ。8E(エクサ)FLOPSの演算性能と100TBのメモリを搭載し、メモリ帯域幅は毎秒1.7P(ペタ)Bを実現するという。

 Rubin CPX単体については、NVIDIAが開発した4bit量子化技術「NVFP4」を用いることで、演算性能は最大30PFLOPSに達する。搭載するメモリはGPU規格「GDDR7」準拠で、128GBの容量を有し、高負荷なワークロード処理の高速化を図っている。動画のデコーダーとエンコーダー、長文コンテキスト推論処理を単一のチップに集約しつつ、文脈理解の中核を担う「アテンション」処理専用のアクセラレータを内蔵することで、従来システムよりも高速化を図っているとNVIDIAは説明する。

 ソフトウェア面では、NVIDIAが提供するAI開発環境全体で性能を発揮する。企業はエンタープライズAIの開発、実行環境「NVIDIA AI Enterprise」を通じてRubin CPXを利用し、マルチモーダルAI「NVIDIA Nemotron」ファミリーのような、高度なAIモデルを実行可能だ。

 「かつて『NVIDIA RTX』がグラフィックスとAIに革命をもたらしたように、Rubin CPXは大規模コンテキストを扱うAI向けに設計された当社初のGPUだ」と、同社の創業者兼CEOであるジェンスン・フアン氏は述べる。

 AIコーディングエディタ「Cursor」を提供するAnysphereやRunway AI、Magic AIといったAI企業が、自社アプリケーションの高速化に向けてRubin CPXの活用を検討している。

 Rubin CPXの提供開始時期は2026年末の予定だ。

このニュースのポイント

Q: NVIDIAが発表した新GPU「Rubin CPX」の特徴は?

A: 大規模コンテキスト推論や長文処理に特化し、数百万トークンを扱うコード生成や長時間動画生成などAI処理を高速化するGPU。

Q: Rubin CPX単体の主要スペックは?

A:

  • NVFP4による4bit量子化で最大30PFLOPS演算性能
  • GDDR7準拠の128GBメモリ搭載
  • 動画処理、長文推論、アテンション専用アクセラレータを集約

Q: 利用を検討している企業は?

A: AIコーディング支援「Cursor」を提供するAnysphere、Runway AI、Magic AIなどが活用を計画。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る