NVIDIA、新GPU「Rubin CPX」発表　数百万トークン規模のAI処理を可能に：「RTXが起こした革命の再来」とCEOが強調

NVIDIAは大規模コンテキストを処理するAI用の新GPU「Rubin CPX」を発表した。数百万トークン規模の処理を可能にし、コード生成や映像処理の分野で画期的な性能を実現するという。

[＠IT] PC用表示関連情報

LINE

Hatena

　NVIDIAは2025年9月9日（米国時間）、新GPU「Rubin CPX」を発表した。膨大な情報を一度に扱うAI（人工知能）処理に特化しており、開発プロジェクト全体で数百万トークンに及ぶコードを読み込んでコーディングをしたり、長時間の動画を生成したりといったタスクを高速化する。

リリース

大規模コンテキストを扱うAIに特化したGPU

　Rubin CPXは、NVIDIAが発表した新システム「NVIDIA Vera Rubin NVL144 CPX」内で動作する。NVIDIA Vera Rubin NVL144 CPXは、大量のNVIDIA製CPUとGPUを1つのラックに集約し、大規模コンテキスト推論や長文処理に最適化されたAI特化型コンピューティングシステムだ。8E（エクサ）FLOPSの演算性能と100TBのメモリを搭載し、メモリ帯域幅は毎秒1.7P（ペタ）Bを実現するという。

　Rubin CPX単体については、NVIDIAが開発した4bit量子化技術「NVFP4」を用いることで、演算性能は最大30PFLOPSに達する。搭載するメモリはGPU規格「GDDR7」準拠で、128GBの容量を有し、高負荷なワークロード処理の高速化を図っている。動画のデコーダーとエンコーダー、長文コンテキスト推論処理を単一のチップに集約しつつ、文脈理解の中核を担う「アテンション」処理専用のアクセラレータを内蔵することで、従来システムよりも高速化を図っているとNVIDIAは説明する。

　ソフトウェア面では、NVIDIAが提供するAI開発環境全体で性能を発揮する。企業はエンタープライズAIの開発、実行環境「NVIDIA AI Enterprise」を通じてRubin CPXを利用し、マルチモーダルAI「NVIDIA Nemotron」ファミリーのような、高度なAIモデルを実行可能だ。

　「かつて『NVIDIA RTX』がグラフィックスとAIに革命をもたらしたように、Rubin CPXは大規模コンテキストを扱うAI向けに設計された当社初のGPUだ」と、同社の創業者兼CEOであるジェンスン・フアン氏は述べる。

　AIコーディングエディタ「Cursor」を提供するAnysphereやRunway AI、Magic AIといったAI企業が、自社アプリケーションの高速化に向けてRubin CPXの活用を検討している。

　Rubin CPXの提供開始時期は2026年末の予定だ。

このニュースのポイント

Q: NVIDIAが発表した新GPU「Rubin CPX」の特徴は？

A: 大規模コンテキスト推論や長文処理に特化し、数百万トークンを扱うコード生成や長時間動画生成などAI処理を高速化するGPU。

Q: Rubin CPX単体の主要スペックは？

NVFP4による4bit量子化で最大30PFLOPS演算性能
GDDR7準拠の128GBメモリ搭載
動画処理、長文推論、アテンション専用アクセラレータを集約

Q: 利用を検討している企業は？

A: AIコーディング支援「Cursor」を提供するAnysphere、Runway AI、Magic AIなどが活用を計画。

NVIDIA、新GPU「Rubin CPX」発表　数百万トークン規模のAI処理を可能に：「RTXが起こした革命の再来」とCEOが強調

大規模コンテキストを扱うAIに特化したGPU

このニュースのポイント

関連記事

関連リンク

Server & Storage 記事ランキング

NVIDIA、新GPU「Rubin CPX」発表 数百万トークン規模のAI処理を可能に：「RTXが起こした革命の再来」とCEOが強調

大規模コンテキストを扱うAIに特化したGPU

このニュースのポイント

関連記事

関連リンク

Server & Storage 記事ランキング

NVIDIA、新GPU「Rubin CPX」発表　数百万トークン規模のAI処理を可能に：「RTXが起こした革命の再来」とCEOが強調