NVIDIAは大規模コンテキストを処理するAI用の新GPU「Rubin CPX」を発表した。数百万トークン規模の処理を可能にし、コード生成や映像処理の分野で画期的な性能を実現するという。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
NVIDIAは2025年9月9日(米国時間)、新GPU「Rubin CPX」を発表した。膨大な情報を一度に扱うAI(人工知能)処理に特化しており、開発プロジェクト全体で数百万トークンに及ぶコードを読み込んでコーディングをしたり、長時間の動画を生成したりといったタスクを高速化する。
Rubin CPXは、NVIDIAが発表した新システム「NVIDIA Vera Rubin NVL144 CPX」内で動作する。NVIDIA Vera Rubin NVL144 CPXは、大量のNVIDIA製CPUとGPUを1つのラックに集約し、大規模コンテキスト推論や長文処理に最適化されたAI特化型コンピューティングシステムだ。8E(エクサ)FLOPSの演算性能と100TBのメモリを搭載し、メモリ帯域幅は毎秒1.7P(ペタ)Bを実現するという。
Rubin CPX単体については、NVIDIAが開発した4bit量子化技術「NVFP4」を用いることで、演算性能は最大30PFLOPSに達する。搭載するメモリはGPU規格「GDDR7」準拠で、128GBの容量を有し、高負荷なワークロード処理の高速化を図っている。動画のデコーダーとエンコーダー、長文コンテキスト推論処理を単一のチップに集約しつつ、文脈理解の中核を担う「アテンション」処理専用のアクセラレータを内蔵することで、従来システムよりも高速化を図っているとNVIDIAは説明する。
ソフトウェア面では、NVIDIAが提供するAI開発環境全体で性能を発揮する。企業はエンタープライズAIの開発、実行環境「NVIDIA AI Enterprise」を通じてRubin CPXを利用し、マルチモーダルAI「NVIDIA Nemotron」ファミリーのような、高度なAIモデルを実行可能だ。
「かつて『NVIDIA RTX』がグラフィックスとAIに革命をもたらしたように、Rubin CPXは大規模コンテキストを扱うAI向けに設計された当社初のGPUだ」と、同社の創業者兼CEOであるジェンスン・フアン氏は述べる。
AIコーディングエディタ「Cursor」を提供するAnysphereやRunway AI、Magic AIといったAI企業が、自社アプリケーションの高速化に向けてRubin CPXの活用を検討している。
Rubin CPXの提供開始時期は2026年末の予定だ。
Q: NVIDIAが発表した新GPU「Rubin CPX」の特徴は?
A: 大規模コンテキスト推論や長文処理に特化し、数百万トークンを扱うコード生成や長時間動画生成などAI処理を高速化するGPU。
Q: Rubin CPX単体の主要スペックは?
A:
Q: 利用を検討している企業は?
A: AIコーディング支援「Cursor」を提供するAnysphere、Runway AI、Magic AIなどが活用を計画。
Copyright © ITmedia, Inc. All Rights Reserved.