NVIDIA Rubinプラットフォーム:CES 2026発表からRubin GPU・Vera CPUの詳細スペックまで

NVIDIA、次世代AIプラットフォーム「Rubin」の発表
NVIDIA Rubinの技術仕様詳細

NVIDIA、次世代AIプラットフォーム「Rubin」の発表

NVIDIAは、AI技術の進化をさらに加速させるための次世代プラットフォームとして、「Rubin」を発表しました。このプラットフォームは、AIの生産性をスケールアップするための包括的な設計を採用しており、複数のチップを統合したシステムです。発表は2026年1月5日にCESで行われ、AI分野での新たなスタンダードを確立する可能性を秘めています。

発表の背景とタイミング

この発表は、NVIDIAのCEOであるJensen Huang氏により、CES 2026の場で公開されました。Rubinは、Blackwellプラットフォームの後継として位置づけられており、AIの生成と推論のコストを大幅に削減することを目指しています。具体的には、AI推論のコストを10倍低減させる可能性が示唆されていますが、これはプラットフォームの統合設計によるものです。

プラットフォームの構成要素

Rubinプラットフォームは、6つの新しいチップで構成されています。これには、CPU、GPU、ならびに4つのネットワーキングプロセッサが含まれ、AIデータセンター向けの最適化が施されています。この設計は、極端なco-designを適用し、コンピュート、ストレージ、ネットワーキングを緊密に連携させることで、AIのスケーラビリティを向上させます。

技術的な特徴と影響

プラットフォームの核心は、AIスーパーコンピュータとしての機能にあり、インテリジェンスの生産を大規模化するためのものです。AWSをはじめとするクラウドプロバイダーとの連携も発表されており、将来的な可用性が期待されます。また、ネットワークサポートが強化された点が、AIデータセンターの効率化に寄与します。

今後の展開

Rubinの発表は、NVIDIAのAI戦略の継続を示すものであり、開かれたモデルや自律走行技術との統合も視野に入れられています。詳細なリリーススケジュールは明らかになっていませんが、業界全体への影響が注目されています。

NVIDIA Rubinの技術仕様詳細

NVIDIAのRubinプラットフォームは、AIスーパーコンピュータとして設計されたラック規模のシステムで、6つの新しいチップを統合しています。これにはVera CPU、Rubin GPU、NVLink 6 Switch、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6 Ethernet Switchが含まれ、AI工場向けの極端なco-designを採用しています。このプラットフォームは、Vera Rubin NVL72として72個のRubin GPUと36個のVera CPUを統括し、NVFP4推論で3,600 PFLOPSの性能を提供します。

Rubin GPUの仕様

Rubin GPUは、トランスフォーマー時代向けの実行エンジンとして機能し、336億個のトランジスタと2つのコンピュートダイを備えています。224のストリーミングマルチプロセッサ(SM)を搭載し、第6世代のTensor Coreを備えています。性能面では、NVFP4推論で50 PFLOPS、NVFP4トレーニングで35 PFLOPSを達成します。メモリは288 GBのHBM4を搭載し、帯域幅は22 TB/sです。NVLink帯域幅は3.6 TB/sの双方向、NVLink-C2Cは1.8 TB/sの双方向、PCIe Gen6インターフェースは256 GB/sの双方向です。第3世代のTransformer Engineを搭載し、ハードウェア加速適応圧縮をサポートします。

Vera CPUの仕様

Vera CPUは、AI工場向けに設計された高帯域幅のデータ移動エンジンで、88個のNVIDIAカスタムOlympusコアと176スレッドを備えています。メモリは最大1.5 TBのLPDDR5Xで、帯域幅は1.2 TB/sです。NVLink-C2C帯域幅は1.8 TB/sの双方向、PCIe Gen6/CXL 3.1をサポートします。キャッシュはコアあたり2 MBのL2と162 MBの統合L3です。Arm v9.2アーキテクチャを採用し、SIMDとして6x 128b SVE2 FP8を搭載しています。第2世代のNVIDIA Scalable Coherency Fabricを備え、機密コンピューティングをネイティブにサポートします。

NVLink 6 Switchの仕様

NVLink 6 Switchは、ラック規模のスケールアップファブリックとして、GPUあたり3.6 TB/sの双方向帯域幅を提供します。NVL72システムでは72 GPU間の全対全通信をサポートし、単一ホップの接続で均一なレイテンシを実現します。In-Network ComputeとしてSHARPを搭載し、FP8集団演算でトレイあたり14.4 TFLOPSを達成します。トレイあたりの総帯域幅は28.8 TB/s、ラックあたり260 TB/sです。機能として、低レイテンシスイッチング、ホットスワップ可能トレイ、動的リルーティングを備えています。

ConnectX-9 SuperNICの仕様

ConnectX-9 SuperNICは、高スループットと低レイテンシのネットワークインターフェースで、ポートあたり800 Gb/s、GPUあたり1.6 Tb/sの帯域幅を提供します。プログラマブルRDMAトランスポート、輻輳制御、トラフィックシェーピングを搭載し、マルチテナント向けのパフォーマンス分離をサポートします。セキュリティとしてIPsec/PSP暗号化、データ・アット・レスト暗号化、セキュアブートを備えています。

BlueField-4 DPUの仕様

BlueField-4 DPUは、AI工場のオペレーティングシステムを担い、デュアルダイパッケージを採用しています。64コアのNVIDIA Grace CPU、統合ConnectX-9(800 Gb/s)、128 GBのLPDDR5Xメモリ(250 GB/s帯域幅)を備えています。性能として、帯域幅800 Gb/s、IOPs 20M at 4K、ホスト数128Kをサポートします。機能として、RDMA加速ストレージ、ゼロトラストセキュリティ、ASTRAによる信頼制御平面を搭載しています。

Spectrum-6 Ethernet Switchの仕様

Spectrum-6 Ethernet Switchは、スケールアウト接続向けで、スイッチチップあたり102.4 Tb/s(128 x 800 Gb/sポート)の帯域幅を提供します。200G PAM4 SerDesを採用し、コパッケージドオプティクスを備えています。機能として、Spectrum-X Ethernetによる予測可能な低レイテンシ、適応ルーティング、無損失をサポートし、電力効率5倍、アップタイム5倍を達成します。

全体システムの特徴

Rubinプラットフォームは、第3世代NVIDIA MGXを基盤とし、モジュラーでホットスワップ可能なコンポーネントを採用しています。電力と冷却として、45°C供給温度の温水単相直接液体冷却をサポートし、ラックレベル電力平滑化でピーク電力変動を低減します。セキュリティとして、エンドツーエンド暗号化と機密コンピューティングを備え、信頼性としてラック規模RASとゼロダウンタイムメンテナンスを実現します。