Physical AI驱动实体智能革命 多模态机器人产业迈入关键时代 智能应用 影音
D Book
236
DForum0121
member

Physical AI驱动实体智能革命 多模态机器人产业迈入关键时代

  • 陈俞萍台北

「AI × Robotics多模态机器人开启产业智能新时代」论坛现场盛况。EDOM
「AI × Robotics多模态机器人开启产业智能新时代」论坛现场盛况。EDOM

AI技术正快速推动机器人产业迈向自主化与高度协作的新阶段,多模态感知、边缘推论以及Physical AI的落地,使机器的感知、决策与移动逻辑发生根本性改变。为协助产业掌握这股技术变革脉动,益登科技于12月3日举办「AI × Robotics多模态机器人开启产业智能新时代」论坛汇聚各领域专家,共同剖析AI如何在真实场域中重塑机器人架构,并推动产业进入新一轮智能化竞争。

益登科技CEO于俊洁在致词时指出,益登自1998年起与NVIDIA合作,完整见证运算能力从数据中心跃升至边缘端的变革。他强调,AI边缘运算能力将使机器人从过去的目标识别,进阶至具备环境理解、决策判断与动作控制的自主行为。

「AI × Robotics多模态机器人开启产业智能新时代」活动摊位互动实况。EDOM

「AI × Robotics多模态机器人开启产业智能新时代」活动摊位互动实况。EDOM

随着大型模型训练逐步下沉至边缘推论,各式机器人都将在未来十年快速普及,并成为产业智能化的重要基础。这次论坛可见到业界正迎向多模态AI与自主运算深度融合,并反映企业对下一阶段智能机器系统的高度期待。

Physical AI落地架构成形  平台、控制与教育应用同步推进

AI正从纯数码运算走向能够作用于真实世界的Physical AI。为加速产业落地,NVIDIA建构了涵盖模型训练、模拟验证到实体部署的完整技术架构,形成机器人智能化的基础设施。从数据中心级的NVIDIA GB200 NVL72训练丛集,到以NVIDIA Omniverse与NVIDIA Cosmos世界模型生成具真实物理特性的合成数据,NVIDIA正逐步克服机器人开发最根本的「数据不足」问题,使模型能在虚拟场景内大量学习并安全迭代。

最终部署阶段则由NVIDIA Jetson AGX Thor接棒,这款搭载 NVIDIA Blackwell GPU、具备2070 TFLOPS运算效能的边缘平台,专为下一代类人机器人与自主系统设计。NVIDIA同时推出涵盖视觉感知、世界模型与类人机器人的预训练模型家族,例如已于Hugging Face开源的NVIDIA Isaac GR00T,可跨不同机器人平台快速移植。

在应用面,NVIDIA以「内向外AI」(机器人视角)与「外向内AI」(环境视角)构成完整场域智能架构,前者透过NVIDIA Isaac系列实现自主导航、操作与决策,后者则由NVIDIA Metropolis的视觉AI代理负责产线监控、巡检与仓储管理,形成从环境到机器人的全链结智能化解决方案。

全球人形机器人市场发展潜力雄厚,控制器架构将面临从未有过的技术门槛。NexCOBOT总经理沈倩怡提到,传统控制器多着重于运动控制,仅相当于机器人的「小脑」,但当AI驱动决策、自主行为逐渐成为主流,产业急需能同时整合视觉感知、推论决策与实时控制的「大脑级」架构,以支撑高自主度、高安全性的下一代机器人。

NexCOBOT推出的MARS400 Physical AI控制器基于此需求设计,以NVIDIA Jetson Thor为核心,结合AI边缘推论与SIL3等级的功能安全控制。MARS400负责传感融合、AI推论、轨迹规划与多协定通讯,并与ESC210安全控制器协作,执行人员侦测、安全运动控制与失效诊断。

其Multi-Master架构将任务分散至多核心处理器,兼具低延迟与高稳定性,同时简化布线。软件层则整合ROS2、实时Linux、NVIDIA Isaac Manipulator与EtherCAT Safety,支持从AI Agent到VLA等新一代机器人框架。在应用面,VLA让机器人能自主生成包装轨迹并因应环境干扰实时重规划,而安全控制器则动态监控人员位置与物体移动,确保协作安全。

AI正逐渐从教育现场的概念示范走向真实工程挑战。安康高中苏鼎钦老师表示,在被誉为「高中生的F1」的FIRST Robotics Competition(FRC)中,全球3,900支队伍必须在短短六周内打造一台54公斤竞赛机器人,从机械、电控到程序与行销皆需跨领域整合。

在这近乎真实工业场景的环境里,传统定位方式常受里程计误差、陀螺仪漂移、场地碰撞与光线变化影响,使机器人无法稳定掌握自身位置,也凸显能「看见世界」的AI视觉定位系统的重要性。

NVIDIA Jetson Orin Nano以40 TOPS运算效能成为核心平台,透过镜头撷取AprilTag,并在30毫秒内完成GPU加速识别、PnP座标求解与里程计融合,输出稳定的定位结果。系统同时整合Single-Tag与Multi-Tag演算法,再利用WPILib扩展卡尔曼滤波器融合视觉、IMU与编码器信号,有效抑制误差累积。

面对光源变化、Multi-Tag飘移与传感器时序差等挑战,团队建立偏移校正、Z轴滤波与时序插值等完整补偿机制;未来将导入自适应滤波器,并扩展至物件识别、路径规划与多机协作应用。

边缘端成Physical AI落地关键点  企业级运算架构全面成形

机器人从工厂与物流场域走向医药与精密制程,边缘端AI的效能瓶颈成为能否落地的关键。Avalanche ComputingCEO陈俊杰指出,Physical AI要在实时推论、低延迟决策与多传感器融合间取得平衡,必须同时满足「最大运算量、最低功耗、最低延迟」三大条件。

随着AMR、机械手臂到类人机器人的需求快速扩张,如何让单一边缘平台整合IMU、力觉、RGB-D、LiDAR等多模态输入并稳定运作,逐渐成为新时代机器人系统的核心议题。

Avalanche以NVIDIA Jetson Thor为基础打造边缘端Physical AI解决方案,采用System 1与System 2的双系统架构,对应VLM理解场景与扩散模型或Transformer动作模型的实际需求。

为克服标准LLM在边缘端因Python GIL、存储器瓶颈等问题,导致推论仅2–3 tokens/s,Avalanche将Isaac ROS GEMs、VPI、CV-CUDA与Pipeline并行化深度整合,在立体视觉、AprilTag、姿态估测等任务上取得最高13倍效能提升。

系统并引入动态资源调度,在LLM思考阶段降低视觉分辨率,在机器人运动时优先视觉运算,同时搭配边缘版RAG确保数据不离场域。透过矽晶原生优化与模块化设计,视觉与LLM推论可弹性切换,整体效能提升可达20%至10倍。相关案例包括LLM×RL的精密操控与药品作业场景,展现边缘端GenAI在企业级机器人落地的实质能力。

AI从云端转向边缘,企业面临的挑战不再只是选择单一硬件,而是如何打造具备训练、模拟到部署能力的完整AI基础建设。益登科技资深技术经理廖宜芳与萧明达在演讲中提到,益登以NVIDIA「3 Computers」为核心策略:训练端采Supermicro HGX、搭载NVIDIA H100或NVIDIA B100用于大型模型与机器人模型训练;模拟端使用Supermicro OVX与NVIDIA Omniverse建立数码分身与合成数据;部署端则以NVIDIA Jetson Thor作为边缘推论与类人机器人的AI控制中心,三者形成从建模到落地的闭环架构。

在软件层面,NVIDIA AI Enterprise被定位为企业级「AI操作系统」,提供模型训练、调校、部署、GPU管理与安全维运工具,并透过NVIDIA NIM支持语音、影像与对话模型的快速上线。益登以文字情感分析案例展示数据加载、训练、评估与容器化部署流程,证实NVAIE作为「AI工厂」的可复制效益。

垂直应用则由NVIDIA Metropolis与NVIDIA Isaac两大平台支撑,前者涵盖智能城市、工厂安全与异常行为侦测,后者整合模拟、视觉、操控与强化学习,并与NVIDIA OVX协助产生合成数据以加速开发。

廖宜芳与萧明达强调,AI落地绝非依赖单一模型或硬件,而是必须以NVIDIA HGX、OVX、Jetson Thor与NVAIE构筑企业级AI Factory,串接数据中心、模拟平台与边缘运算,为台湾产业进入Physical AI、边缘智能与自主机器人时代奠定真正的底层能力。

建构多模态机器人生态  Physical AI迈向实务部署的关键基础

除了精彩演讲,会中也邀请多位专家,针对「多模态机器人新生态:技术、应用与合作展望」议题进行对谈。VLA目前仍停留在研究与POC阶段,尚未有量产部署案例,关键瓶颈在于机器人数据取得困难,后段数据整备涉及标注、时序对齐与轨迹重建等繁琐流程,即使投入大量人力也难以快速累积可训练数据,因此「数据生成」已成产业关键。

为此,NVIDIA近年在NVIDIA Isaac GR00T与多项SDK中强化数据生成能力,并以GPU进行加速处理。此外,目前机器人多采System 1(快控制)与System 2(慢决策)架构,无论是VLM或VLA,其底层皆以转换器模型为核心,用于整合影像、语言与动作等多模态信号。

机器人王国CAVEDU创始人曾吉弘表示,NVIDIA的SDK与技术资源庞杂,初学者容易被信息量淹没,因此建议善用NVIDIA DLI(深度学习学院)规划的学习路径,循序补足基础再进阶至VLM等高端应用,才能避免跟不上进度。他也指出,台湾近年在科技教育上的投入逐步深化,AI与机器人具高度跨域特性,从工程、电机到心理与语言学皆可切入,凭藉扎实的学术能量与人才基础,台湾具备持续推进AI与机器人发展的良好条件。

Holon Robotics共同创始人杨宜哲指出,新创必须在「快速落地」与「持续研发」间取得平衡。加入NVIDIA Inception Program后,团队透过DLI与RGOS等技术培训,将AI、机器人与视觉传感实际导入制造现场,解决如抛光研磨「调机时间过长」的痛点。他也强调新创交流的重要性,不同领域团队虽任务各异,却共享技术挑战,NVIDIA平台成为重要后盾;加上近年政府从竞赛、培育到资金的多元支持,使台湾逐步形塑友善的新创发展环境。

Taiwan ROS Community创始人简文昱则表示,他同时经营「ROS Taiwan」与2023年成立的「Taiwan Robotics Meetup」,后者专为补足工程师缺乏深度技术交流空间而设。活动从不到十人逐步成长,2025年ROSCon已突破150人,并与多家企业与协会合作。他强调,实体聚会有助工程师交流实务经验、共同除错,也能为企业降低开发成本,并期待更多企业提供场地,推动巡回式技术交流,促进台湾机器人社群持续成长。

从云端模型训练到边缘端实时推论,从模拟世界到真实场域落地,「AI × Robotics多模态机器人开启产业智能新时代」论坛完整呈现了Physical AI与机器人技术的关键进展与产业挑战。随着运算平台、数据生成与软硬整合能力持续成熟,AI正加速走出虚拟空间,走向可规模化部署的实体智能阶段,也为台湾机器人与智能制造产业开启新一轮竞逐舞台。

关键字