NVIDIA推出世界基础模型平台 加速开发实体AI
NVIDIA宣布推出NVIDIA Cosmos平台,在这个平台里包含最先进的生成世界基础模型、先进的标记器、防护机制和加速视讯处理管道,用于推动自驾车和机器人等实体人工智能系统的发展。
实体AI模型开发成本高昂,需要大量的真实世界数据和测试。Cosmos世界基础模型(WFM)让开发人员能够方便产生大量逼真又符合物理原则的合成数据,以训练和评估其现有模型。
NVIDIA创始人暨CEO黄仁勳表示:「机器人的ChatGPT时刻即将到来。就像大型语言模型一样,世界基础模型是推动机器人和自驾车发展的基础,却又不是所有开发人员都拥有专业知识和资源来训练自己的模型。我们创造Cosmos是为了普及实体AI,让每一位开发人员都能掌握一般机器人技术。」
开放世界基础模型,加速推动发展下一波AI浪潮NVIDIA Cosmos的开放模型套件代表开发人员可以视自己目标应用的需求,使用数据集自订WFM,例如自驾车的行车录影画面或是机器人穿梭在仓库里。
专为实体AI研发工作而生的Cosmos WFM,可从文字、影像、视讯等输入数据,以及机器人传感器或动作数据的组合,产生符合物理原则的影片。专为符合物理原则的互动、物件持久性,以及生成高品质模拟工业环境和驾驶环境而建立这些模型。
实体AI产业的先驱业者已经开始采用Cosmos技术
AI及人型机器人公司1X使用Cosmos Tokenizer推出1X World Model Challenge数据集。小鹏汽车将使用 Cosmos加速开发自家的人型机器人。而 Hillbot和SkildAI则是使用Cosmos来快速开发自家的通用机器人。
Agility技术长Pras Velagapudi表示:「数据稀少和多变是机器人环境中成功学习的主要难题。Cosmos的文字转世界、影像转世界和视讯转世界的功能,让我们能够在各种任务中产生和增强那些栩栩如生的场景,我们可以利用这些场景来训练模型,不用花费大量时间心力去取得实体世界的信息。」
交通运输业的领导业者同样使用Cosmos为自驾车建立实体AI
Wayve是一家开发自动驾驶AI基础模型的公司,正在评估将Cosmos作为搜索用于安全性和验证之边缘和极端行车情况的工具。提供自驾车工具链的Foretellix将使用Cosmos与NVIDIA Omniverse Sensor RTX API,以评估和产生大量真实感十足的测试场景和训练数据。
全球乘车服务巨擘Uber将与NVIDIA合作,加速推动发展自动驾驶移动技术。Uber提供丰富的驾驶数据集,结合Cosmos平台与NVIDIA DGX Cloud的功能,将协助自驾车合作夥伴更有效率地建立更强大的AI 模型。
UberCEODara Khosrowshahi表示:「生成式AI将用于支持未来的交通运输服务,这需要丰富的数据和非常强大的运算能力。我们与NVIDIA合作,有信心能协助推动业界发展出安全且具扩充性的自动驾驶解决方案时间表。」
开放的Cosmos平台包含专为减缓有害文字与影像而设计的防护机制,具备加强文字提示准确性的工具。在 NVIDIA API目录上使用Cosmos自回归和扩散模型产生的影片会有一个隐形浮水印,用于识别AI产生的内容,有助于减少错误信息和张冠李戴的机会。
现已可在Hugging Face及NVIDIA NGC目录上,以NVIDIA开放模型授权的方式取得Cosmos WFM。即将以彻底最佳化NVIDIA NIM微服务的形式提供Cosmos模型。开发人员可以使用NVIDIA NeMo Curator 来加快处理讯内容,并且使用NVIDIA NeMo订制自己的世界模型。
NVIDIA DGX Cloud让使用者可以便捷地部署这些模型,并且透过NVIDIA AI Enterprise软件平台提供企业支持服务。另有推出全新NVIDIA Llama Nemotron大型语言模型和NVIDIA Cosmos Nemotron视觉语言模型,开发人员可将这些模型用于医疗保健、金融服务、制造业等领域的企业 AI 使用案例。