Physical AI:从Feature Robot到Smart Robot

徐宏民
2026-06-18
AI语音摘要
00:52

过去十年,全球投入实体AI(Physical AI)与机器人新创的年度创投金额,从几亿美元的规模成长到接近250亿美元,是10倍以上的成长曲线,集中在最近这几年。

这个数字背后,隐含著一个更早就存在的刚需:主要经济体的工作年龄人口持续下滑,如日本到2050年代将只剩2000年的6成左右。但「Physical AI」这个词底下,到底蕴含怎样的机会,是否真的对得上那条人口曲线所描述的缺口,值得拆开来看。

机器人产业并不是第一次站上资本聚光灯下。Bay Area Robotics Association执行董事Terence Bennett在东京Humanoids Summit 2026把美国机器人产业的发展分成3波:

第一波在1960到80年代的底特律,靠的是汽车产业的资本支出,技术堆叠是机械手臂、焊接、涂装、围栏工作站;

第二波在2005到2024年的波士顿,协作机器人与移动底盘从DARPA的早期投入走向仓储物流的商业应用;

第三波从2024年开始在硅谷展开,资本来源从纯軟件的创投,开始大量流入需要与实体世界互动的公司,技术堆叠变成基础模型与VLA,操作被当成一个学习问题,而不是程序设计问题。

Bennett用一句话概括这个转折:「The model, not the mechanism」;前两波靠的是把机械做得更好,第三波靠的是把模型做得更通用。

前两波对生产力的提升,其实是扎实且持续的。第一波的机械手臂解决的是一个被严格限定的问题:在固定场景、缺省路径、封闭围栏里,把单一任务做到极致,速度快、精度高、正确率极高,至今仍是全球工厂的骨干。第二波的协作机器人与移动平臺把能力范围扩大一截,机器人开始可以在人的旁边工作,也开始可以自己移动,但移动的前提仍是预先规划好的场域:固定路径、格状地板、不允许外物进入。

这两波做出来的,本质上都是「feature robot」:功能集合不同、精密程度不同,但共同特征是在一个被定义好的框架内,把功能做到接近完美,就像feature phone把通话品质与待机时间做到极致。

第三波想做的是「smart robot」。本文暂且将smart robot定义为:能在未完全预先定义的环境中,自主感知、规划与执行任务,并具备持续运作能力;若以商业部署标准衡量,连续运作10小时以上是一个可观察指标。

feature robot的成果,现在仍在持续发生,而且规模比多数人想像得大。服务场域里,已经有不少高端餐饮业者让送餐机器人负责外场的搬运与行进路线,把服务人员的时间释放到桌边互动与品质把关上,机器人做的是「移动加搬运」这个被切得很干净的子任务,人做的是需要判断与温度的部分。物流场域的规模更大:某全球电商在超过100个仓储中部署逾100万臺自主移动机器人,搭配相当规模的人力协作,每天出货超过1,000万个包裹。这些机器人跑的是预先铺设的格状地板与固定路径,不是在开放场域中實時感知与决策,但这套组合已经支撑全球规模最大的物流網絡之一。feature robot这条路径没有过时,它仍在创造实际的生产力。

那么,第三波到底想往哪里去?

要回答这个问题,与其直接猜测时间表,不如透过几组对照,看清楚哪些系统设计、哪些技术重心,是真正属于第三波、而不是前两波的延伸。

第一组对照是机器人与电动车,两者在供应链结构上有明显的重叠,致动器、磁铁、电池材料的供应路径高度相似,电动车产业10年来建立的制造能力,正在直接转用到机器人零组件上。但硬件基础齐备,不代表问题已经解决。电动车本质上是换了动力系统的交通工具,驾驶这件事人类已经做了上百年,技术积累可以直接沿用;机器人面对的问题更底层——「什么是正确的动作」本身就需要重新定义,这是一个泛化问题,难度比电动车高了一个量级。

电动车的感知目的是避障,机器人的感知目的却是接触与操作,必须碰得精准。前两波是靠缩小场景范畴解决「碰得精准」的问题;第三波要在开放场域中做到同样的精度,硬件已经不是瓶颈,瓶颈转移到模型能否泛化这一层。这个差异也解释为什么电动车的商业转折点已经发生,而机器人即使资本大量投入,距离大规模商业转折点仍有一段距离。

过去60年机器人的成功,建立在同一套技术逻辑:尽量拿掉场景的不确定性,让机器人在规划过的环境里,把固定任务做到接近完美,重复定位精度早已解决到亚毫米级。第二组对照正是Physical AI与第一波的工业机器人:Physical AI想打破的正是这个前提,在开放场域、动态环境、没有预先定义的结构下仍能完成任务。

这也是为什么今天大多数所谓「自主机器人」的成功部署,骨子里仍是工业机器人的逻辑:先把问题范畴缩小,再宣称已经自主。

把这几组对照放在一起看,会发现一个熟悉的历史节奏。在smartphone出现之前,有线电话、大哥大、feature phone已经把通讯这件事做得相当好,通话清晰、待机时间长,把一个被定义好的功能做到极致。

2007年smartphone的出现,并不是让通话变得更好,而是打开了一个原本不存在的维度:应用生态、随时聯網、装置成为平臺。feature robot这十几年的成果,如同feature phone的那段历史:扎实、有效,但运作在一个被定义好的框架里。smart robot现在仍处于那个框架被打开之前的阶段,资本市场涌入的250亿美元,期待的正是这个打开的时刻。

第三波若真的成立,价值重心可能逐渐从机构件移向感知、运算与模型能力——这个分岔对臺湾供应链不是抽象问题。延续Bennett「the model, not the mechanism」的框架:当机器人的价值重心真的从机构转向模型,臺湾过去在精密机械组装、马达齿轮上的优势,会如何转化?智能手機时代给过一个参考答案:当产业价值逐渐向操作系統、生态系与平臺集中时,价值未必留在制造规模最大的地方,而是留在最能定义产业规则的位置。

台灣大學信息工程学系教授,曾任富士康集团与Stellantis合资车用科技公司技术长暨副总经理,推动ADAS及智能座舱系统产品进入全球车用市场。纽约哥伦比亚大学电机博士,专精于机器学习、电脑视觉、自驾车、机器人等领域。为讯连科技研发团队创始成员,慧景科技(thingnario)共同創始人,NVIDIA AI Lab計劃主持人;曾任IBM华生研究中心及美国微软研究院客座研究员。担任多家科技公司AI策略顾问,习惯从学术与产业双重视角检验技术发展的机会与挑战。<br>
智能应用 影音