NVIDIA推出Rubin CPX 专为大规模情境推论而打造的新一代GPU

陈俞萍／台北
2025/10/02 03:08
分享

NVIDIA推出Rubin CPX，专为大规模情境推论而打造的新一代GPU。NVIDIA

NVIDIA今日宣布推出NVIDIA Rubin CPX，一款专为大规模情境（context）处理而打造的新一代GPU。Rubin CPX使得人工智能（AI）系统能以突破性的速度与效率，处理百万个词元（token）的软件编码与影片生成。

Rubin CPX与全新NVIDIA Vera Rubin NVL144 CPX平台中的NVIDIA Vera CPU和Rubin GPU协同工作。这款整合式NVIDIA MGX系统在单一机架配置下拥有8 exaflops的AI运算能力，可提供比NVIDIA GB300 NVL72系统高出7.5倍的AI效能，同时配备100TB快速存储器及每秒1.7 PB的存储器带宽。

NVIDIA也将提供一个专属的Rubin CPX运算托盘（compute tray），以满足客户希望重复利用现有Vera Rubin 144系统的需求。

NVIDIA创始人暨CEO黄仁勳表示：「Vera Rubin平台将标志着AI运算领域的又一次跃进，不仅推出新一代Rubin GPU，更创造名为CPX的全新处理器类别。正如RTX为图形与物理AI领域带来革命性的改变，Rubin CPX是首款专为大规模情境AI打造的CUDA GPU，能让模型同时处理具备数百万个词元的推理任务。」

NVIDIA Rubin CPX可在处理长情境时提供最高效能与词元收益，远超当今系统设计所能承载的范畴。这让AI程序码助理从简单的程序码生成工具，转型为可理解并最佳化大型软件项目的复杂系统。

AI模型可能需要使用多达100万个词元来处理一小时内容的影片，这已经达到传统GPU运算的极限。Rubin CPX将影片解码器与编码器，以及长情境推论处理技术整合至单一芯片，为影片查找与高品质生成影片等长格式应用，实现前所未有的功能。

Rubin CPX GPU采用NVIDIA Rubin架构，采用经济实惠的单芯片设计，搭载强大的NVFP4运算资源，并经过最佳化，可为AI推论任务提供极高的效能与能源效率。

Rubin CPX带来的进步

Rubin CPX以NVFP4精度技术提供高达30 petaflops的运算能力，实现最高效能与准确性。其采用128 GB 经济实惠的GDDR7存储器，可加速处理要求最严苛、基于情境的工作负载。此外，与NVIDIA GB300 NVL72系统相比，Rubin CPX的系统专注力提升3倍，在不减缓速度的情况下，大幅提高AI模型处理更长情境序列的能力。

Rubin CPX提供多种配置选项，包括Vera Rubin NVL144 CPX，可结合NVIDIA Quantum‑X800 InfiniBand横向扩展运算架构，或是搭配采用NVIDIA Spectrum-XGS以太网络技术与NVIDIA ConnectX-9 SuperNICs的NVIDIA Spectrum-X以太网络平台。透过Vera Rubin CPX，企业得以实现前所未有的盈利规模，每投资1亿美元即可获得50亿美元的词元收益。

业界领袖选择Rubin CPX

AI创新者正探索如何以Rubin CPX加速其应用，涵盖从大规模软件开发到动态视觉内容分析，以便更深入了解动态影像。

Cursor是一家提供高端程序码编辑器的AI软件公司，该公司认为Rubin CPX的优势在于能够直接在程序码环境中，透过智能程序码生成与协作工具，大幅提高开发人员工作效率。

CursorCEOMichael Truell表示：「借助NVIDIA Rubin CPX，Cursor将能提供如闪电般快速的程序码生成与开发人员洞察，从而彻底改变软件创作方式。这将把工作效率提升至新高度，并让使用者能够将过去无法实现的创意付诸实践。」

美国生成式AI公司 Runway 将采用NVIDIA技术，帮助创作者以无与伦比的规模与效率，制作出具有电影质感的内容与尖端的视觉效果。

RunwayCEOCristóbal Valenzuela表示：「影片生成技术正迅速发展，朝向情境更长且更灵活的代理驱动创意工作流程。我们认为Rubin CPX是效能上的重大突破，可支持这些要求严苛的工作负载，进而建构更通用且智能的创意工具。这意味着从独立艺术家到大型工作室的创作者，都可以在作品中获得前所未有的速度、真实感与掌控力。」

Magic是一家正在开发基础模型的AI研究与产品公司，以驱动可自动化软件工程的AI代理。

MagicCEOEric Steinberger表示：「透过包含1亿个词元的情境窗口，我们的模型无需微调即可完整查看程序码库、多年互动历史、文件与函式库的情境。这项技术让使用者能在测试阶段时透过对话和存取环境来训练代理，让我们更接近自主代理体验。采用NVIDIA Rubin CPX这类GPU技术，可大幅加速我们的运算工作负载。」

NVIDIA Rubin CPX将获得完整的NVIDIA AI技术堆叠支持，从加速基础设施到企业级软件皆涵盖其中。NVIDIA Dynamo平台可高效扩充AI推论，在大幅提高输送量的同时，缩短回应时间并降低模型服务成本。

这些处理器将能够执行NVIDIA Nemotron系列最新的多模态模型，为企业级AI代理提供最先进的推理技术。针对生产级AI应用，Nemotron模型可透过NVIDIA AI Enterprise软件平台交付。该平台包含NVIDIA NIM微服务，以及AI框架、程序库与工具，企业可将其部署于NVIDIA加速的云端、数据中心与工作站。

Rubin平台以数十年的创新为基础，拓展NVIDIA开发人员生态系，并提供NVIDIA CUDA‑X程序库、逾600万人的开发人员社群，以及近6,000种CUDA应用程序。

NVIDIA Rubin CPX预计于2026年底上市。如欲了解进一步信息，欢迎观看NVIDIA超大规模与高效能运算副总裁Ian Buck于美西时间9月9日上午10:00在AI Infra Summit上的主题演讲。

关键字

AI NVIDIA GPU

加入已选取到「关键字追踪」什麽是「关键字追踪」