NVIDIA生成式人工智能研究在一秒内制作出3D形状
NVIDIA的研究人员在最新的文字转3D生成式人工智能(AI)模型中注入了双倍的加速力量,该模型被称为LATTE3D。就像一台虚拟的3D打印机,LATTE3D能在一秒内将文字提示转换为物体和动物的3D表示形式。
采用了广泛使用于标准渲染应用程序的格式,生成的形状可以轻松地在虚拟环境中使用,用于开发电玩游戏、广告活动、设计项目或机器人的虚拟训练场域。
NVIDIA AI研究副总裁Sanja Fidler所属位于多伦多的AI实验室团队开发了LATTE3D,她表示:「一年前,AI模型生成这种质量的3D视觉效果需要一个小时,而目前的最新技术只需约10~12秒。我们现在能以数量级更快的速度产生结果,使各产业的创作者能够实现近乎实时的文字到3D生成。」
这项进步意味着当在单个GPU上运行推论时,像NVIDIA RTX A6000这样的GPU,LATTE3D能够几乎立即生成3D形状。
构思、生成、迭代:缩短周期
创作者无需从头开始设计或在3D资源库内进行查找,而是可以使用LATTE3D在想法突然出现时,立即产生详细的物件。
该模型基于每个文字提示生成几种不同的3D形状选项,供创作者选择。选定的物体可以在几分钟内进行最佳化,达到更高的品质。然后,使用者可以将形状汇出到图形软件应用程序或平台,如NVIDIA Omniverse,该平台支持基于通用场景描述(OpenUSD)的3D工作流程和应用程序。
虽然研究人员在动物和日常物体这两个特定数据集上训练LATTE3D,但开发人员可以使用相同的模型架构在其他数据类型上训练AI。
例如,如果在3D植物数据集上进行训练,LATTE3D的一个版本可以帮助景观设计师在与客户进行脑力激荡时使用树木、开花灌木和多肉植物快速填充花园渲染图。如果在家庭物品数据集上进行训练,该模型可以产生填充家庭3D模拟的物品,开发人员可以使用这些物品来训练个人助理机器人,然后再于现实世界中进行测试和部署。
LATTE3D使用NVIDIA A100 Tensor核心GPU进行训练。除了3D形状外,该模型还接受了使用ChatGPT 生成的各种文字提示的训练,以提高模型处理使用者可能想出描述特定3D物件的各种短语的能力,例如,理解具有各种犬类物种的提示都应该产生像狗一样的形状。
NVIDIA研究中心由全球数百名科学家和工程师组成,团队专注于AI、电脑图形、电脑视觉、自动驾驶汽车和机器人等主题。研究人员2024年在NVIDIA GTC大会上分享了研究成果,推动了扩散模型训练技术的发展。欢迎至NVIDIA技术博客以了解更多信息,并阅读GTC大会上的NVIDIA研究会议完整列表。
如欲了解最新的NVIDIA AI相关消息,请观看NVIDIA创始人暨CEO黄仁勳在GTC上主题演讲的重播。
- 小螺丝到大数据:Bossard紧固件在AI服务器的应用
- AMAX引领生成式 AI 与实时运动数据革命
- 思想科技助企业加速落实 AI 应用,完整顾问服务突破创新挑战
- 首款AI心肺筛检在国际亮相!展现台湾医学影像创新实力
- 迎接后双轴转型时代 Google AI助攻台湾制造业迈向绿色企业
- 慧荣科技突破数据与功耗瓶颈 全新存储技术加速AI应用发展
- 台师大与丽台携手成立深度学习共同实验室 推动AI技术在教育与产业的应用
- 精诚软件获国科会GenAI Stars生成式AI企业应用竞赛「优质创新奖」
- 运用科技力守护民众生命财产安全 精诚集团协力宜兰县政府部署AIoT智能防灾
- 晶睿通讯AI安防解决方案 导入全新AI功能RealSight Engine
- 西门子推出下一代AI加强型电子系统设计软件
- F5与NetApp加速并简化大型语言模型AI部署
- 新思科技与台积电携手 为AI与多晶粒设计加速创新
- 友讯代理A10 Networks人工智能新蓝图 驱动可靠安全环境
- 边缘 AI:实时数据处理与自动化的革命
- 迎接AI时代:数产署与资策会运用AWS技术
携手伊云谷为企业打造黄金级竞争力 - 技嘉发表开创性的Z890主机板 展现真AI 制霸效能无极限
- 昕力信息与iKala携手拓展东南亚市场 首站支持越南制造业和金融业上云
- AI视觉释放LLM完整潜力,重塑智造管理
- Hitachi Vantara推出Virtual Storage Platform One为混合云存储提供基础