NVIDIA推出Rubin CPX 专为大规模情境推论而打造的新一代GPU 智能应用 影音
D Book
236
TCA-未来科技馆-媒合
member

NVIDIA推出Rubin CPX 专为大规模情境推论而打造的新一代GPU

  • 陈俞萍台北

NVIDIA推出Rubin CPX,专为大规模情境推论而打造的新一代GPU。NVIDIA
NVIDIA推出Rubin CPX,专为大规模情境推论而打造的新一代GPU。NVIDIA

NVIDIA今日宣布推出NVIDIA Rubin CPX,一款专为大规模情境(context)处理而打造的新一代GPU。Rubin CPX使得人工智能(AI)系统能以突破性的速度与效率,处理百万个词元(token)的软件编码与影片生成。

Rubin CPX与全新NVIDIA Vera Rubin NVL144 CPX平台中的NVIDIA Vera CPU和Rubin GPU协同工作。这款整合式NVIDIA MGX系统在单一机架配置下拥有8 exaflops的AI运算能力,可提供比NVIDIA GB300 NVL72系统高出7.5倍的AI效能,同时配备100TB快速存储器及每秒1.7 PB的存储器带宽。

NVIDIA也将提供一个专属的Rubin CPX运算托盘(compute tray),以满足客户希望重复利用现有Vera Rubin 144系统的需求。

NVIDIA创始人暨CEO黄仁勳表示:「Vera Rubin平台将标志着AI运算领域的又一次跃进,不仅推出新一代Rubin GPU,更创造名为CPX的全新处理器类别。正如RTX为图形与物理AI领域带来革命性的改变,Rubin CPX是首款专为大规模情境AI打造的CUDA GPU,能让模型同时处理具备数百万个词元的推理任务。」

NVIDIA Rubin CPX可在处理长情境时提供最高效能与词元收益,远超当今系统设计所能承载的范畴。这让AI程序码助理从简单的程序码生成工具,转型为可理解并最佳化大型软件项目的复杂系统。

AI模型可能需要使用多达100万个词元来处理一小时内容的影片,这已经达到传统GPU运算的极限。Rubin CPX将影片解码器与编码器,以及长情境推论处理技术整合至单一芯片,为影片查找与高品质生成影片等长格式应用,实现前所未有的功能。

Rubin CPX GPU采用NVIDIA Rubin架构,采用经济实惠的单芯片设计,搭载强大的NVFP4运算资源,并经过最佳化,可为AI推论任务提供极高的效能与能源效率。

Rubin CPX带来的进步

Rubin CPX以NVFP4精度技术提供高达30 petaflops的运算能力,实现最高效能与准确性。其采用128 GB 经济实惠的GDDR7存储器,可加速处理要求最严苛、基于情境的工作负载。此外,与NVIDIA GB300 NVL72系统相比,Rubin CPX的系统专注力提升3倍,在不减缓速度的情况下,大幅提高AI模型处理更长情境序列的能力。

Rubin CPX提供多种配置选项,包括Vera Rubin NVL144 CPX,可结合NVIDIA Quantum‑X800 InfiniBand横向扩展运算架构,或是搭配采用NVIDIA Spectrum-XGS以太网络技术与NVIDIA ConnectX-9 SuperNICs的NVIDIA Spectrum-X以太网络平台。透过Vera Rubin CPX,企业得以实现前所未有的盈利规模,每投资1亿美元即可获得50亿美元的词元收益。

业界领袖选择Rubin CPX

AI创新者正探索如何以Rubin CPX加速其应用,涵盖从大规模软件开发到动态视觉内容分析,以便更深入了解动态影像。

Cursor是一家提供高端程序码编辑器的AI软件公司,该公司认为Rubin CPX的优势在于能够直接在程序码环境中,透过智能程序码生成与协作工具,大幅提高开发人员工作效率。

CursorCEOMichael Truell表示:「借助NVIDIA Rubin CPX,Cursor将能提供如闪电般快速的程序码生成与开发人员洞察,从而彻底改变软件创作方式。这将把工作效率提升至新高度,并让使用者能够将过去无法实现的创意付诸实践。」

美国生成式AI公司 Runway 将采用NVIDIA技术,帮助创作者以无与伦比的规模与效率,制作出具有电影质感的内容与尖端的视觉效果。

RunwayCEOCristóbal Valenzuela表示:「影片生成技术正迅速发展,朝向情境更长且更灵活的代理驱动创意工作流程。我们认为Rubin CPX是效能上的重大突破,可支持这些要求严苛的工作负载,进而建构更通用且智能的创意工具。这意味着从独立艺术家到大型工作室的创作者,都可以在作品中获得前所未有的速度、真实感与掌控力。」

Magic是一家正在开发基础模型的AI研究与产品公司,以驱动可自动化软件工程的AI代理。

MagicCEOEric Steinberger表示:「透过包含1亿个词元的情境窗口,我们的模型无需微调即可完整查看程序码库、多年互动历史、文件与函式库的情境。这项技术让使用者能在测试阶段时透过对话和存取环境来训练代理,让我们更接近自主代理体验。采用NVIDIA Rubin CPX这类GPU技术,可大幅加速我们的运算工作负载。」

NVIDIA Rubin CPX将获得完整的NVIDIA AI技术堆叠支持,从加速基础设施到企业级软件皆涵盖其中。NVIDIA Dynamo平台可高效扩充AI推论,在大幅提高输送量的同时,缩短回应时间并降低模型服务成本。

这些处理器将能够执行NVIDIA Nemotron系列最新的多模态模型,为企业级AI代理提供最先进的推理技术。针对生产级AI应用,Nemotron模型可透过NVIDIA AI Enterprise软件平台交付。该平台包含NVIDIA NIM微服务,以及AI框架、程序库与工具,企业可将其部署于NVIDIA加速的云端、数据中心与工作站。

Rubin平台以数十年的创新为基础,拓展NVIDIA开发人员生态系,并提供NVIDIA CUDA‑X程序库、逾600万人的开发人员社群,以及近6,000种CUDA应用程序。

NVIDIA Rubin CPX预计于2026年底上市。如欲了解进一步信息,欢迎观看NVIDIA超大规模与高效能运算副总裁Ian Buck于美西时间9月9日上午10:00在AI Infra Summit上的主题演讲。

关键字