东京Humanoids Summit观察:当实体AI成为有手脚的电动车

徐宏民
2026-06-02

日本大阪大学教授石黑浩教授(类人机器人研究先驱)在Humanoids Summit主题演讲结尾说了一句话「日本在机器人研究上投入了数十年,但还没有杀手级应用」。

日本在工业机器人领域的先驱地位毋庸置疑,川崎、发那科、安川的机械手臂至今仍是全球工厂的骨干;然而近年数据显示,日本制造业的机器人密度已从全球第一跌至第五,数十年的研究积累,未能取得新時代自主机器人的领先优势。回到最基本:机器人最终要回答的问题,是能否提升「生产力」,而不是形态是否像人。

2026年5月底在东京举办的Humanoids Summit,是这个发源自硅谷的论坛首次进军亚洲,汇聚各领域第一线业者与决策者上臺,来自50个国家的与会者同场。包括汽车厂与制造业龙头的机器人策略负责人、基础模型研发团队、机器人新创CEO、法务风险分析师与投资决策者,讨论的是商业化路径,不是研究论文。会场有人把机器人称为「有手脚的汽车」,背后有一条比多数人意识到的更具体的产业逻辑。

会议名称虽叫「人形机器人高峰会」,但两天下来讨论的范围远不止于此。四足机器人已在高速公路涵洞里侦测裂缝、在晶圆厂用热像仪发现帮浦过热、在大型赛事现场执行化学生物威胁侦测,这些是已验收的商业合约,不是展示影片。某家灵巧手厂商出货超过1,000套,物流场域单笔订单超过700万美元。

以Real2Sim2Real數據飞轮为核心的新创,在2026年第1季拿到超过1亿美元订单,说明训练基础建设本身已成为有真实收入的生意。人形机器人只是具身智能的一种形态;这个产业的全貌,是一个还在快速分化的生态系。

笔者在现场持续带著2个问题:眼前这个展示,能否在非受控条件下重现?以及,这个产业何时才能真正放量?

某家灵巧手厂商的发表者在臺上说:「These are real」,连业者都感受到必须主动澄清的压力。灵巧操作是目前公认的最后一道硬件障碍,两天下来技术深度最高的展示是某家车厂的16自由度手内操作,但仍是高度受控的条件。移动与感知已逐渐工程化;卡住的是操作——抓取不同材质、形状、重量的物件,在需要精细力道控制的场域,仍是高失败率的环节。

长时序任务的可靠性是另一道结构性门槛。任务步骤愈多,错误率加速累积,真实场域的容错空间远低于实验室。各家都在针对特定场域补强;现场展示的永远是最有把握的任务;实际部署能可靠执行的范围,远比展示看起来的窄。

真正限制部署的,不完全是技术问题。

产业调查显示,71%的企业主管认为目前最大障碍是「business case 说不通」。成本是直接原因:高端机器人采购成本落在15万~50万美元之间,估计需要降到2万~5万美元,才能打开大规模采购。认证架构同样空白,目前没有任何一套标准完整涵盖具备语言理解与自主决策能力的机器人系统;商业场域发生事故时,制造商、操作者、AI 模型开发者之间的责任归属仍无清楚的法律架构,这是大规模采购无法跳过的前提。

部署因此有其优先顺序。

第一波进入的是结构化环境(制造业产线、物流仓储、基础设施巡检),第二波才是半结构化环境(工地、医院物流、商业设施维运),家庭与照护场域是现场讨论最热烈的,也是目前几乎没有人能可靠做到的。机器人不是从最有趣的地方开始部署,而是从投资报酬率最清楚的地方开始。一个有参考价值的前例:某大型服务机器人当年进入2,000家企业,3年后85%放弃,失败原因有83%不是技术问题,而是与组织流程和人员文化的整合失败。

分工地图则是另一层问题。市场分析列出机器人关键硬件的全球产能分布:永久磁铁中国占 90%、致动器 55%、谐波减速机 45%、电力电子 30%。这些零组件与电动车供应链高度重叠,过去十年中国电动车的快速扩张,同时建立一套可直接转用于机器人量产的制造能力。这是整场讨论的隐性背景,多位讲者都触及这个现实,没有人把它定性为威胁,但数据摊开来,结论不言而喻。现场一张来自欧洲的投影片标示:「China is dancing ahead — From dance floor to the shop floor」。

「有手脚的汽车」这个比喻,对信息电子业的含意相当直接。人形机器人半导体市场估计将从2026年约2,100万美元成长到2050年的1,770亿美元(若涵盖工业机器人与AMR,整体还要大上数倍);每臺高端人形机器人的芯片物料清单约1,400美元——光是70个以上的关节,每个都需要独立的MCU做马达控制,这还不包含推论与感知层的需求。功能安全MCU、马达驱动IC、傳感器信號处理芯片,与车用电子规格需求高度重叠,服务汽车供应链多年的能力在机器人场域有相当程度可以对应。但芯片这一层的分工地图与机械零组件截然不同:傳感器、推论芯片、安全 MCU,日本、美国、欧洲、韓國业者都有明确位置。

再往上是軟件模型层,基础模型的研发重心在硅谷与北京,开源生态让各层的竞争边界持续模糊。同一个「机器人产业」,机械硬件、芯片、軟件三层各有自己的竞争格局,不能用同一张图理解。

两天下来,笔者对这个时间点最清楚的感受是:2026年更像是机器人基础建设的元年——卖铲子的先有生意。训练數據服务、數據收集基础建设、各地數據工厂,真正有确定性收入的环节在供应链的更上游,不只是整机厂商。數據飞轮能否转起来,可能比组装良率更早决定谁在这场竞赛里站稳。

但石黑浩那句话提醒的问题还在:杀手级应用是什么、在哪个场域、谁先找到。电动车的答案不是在实验室里想出来的,是在场域里跑出来的。供应链可以先跑,这个答案却没办法用铲子挖出来;从2013年以来几轮AI技术更替的经验看,在真实场域中贴近客户、理解生态系需要什么的,往往是上升曲线之后的赢家。

台灣大學信息工程学系教授,曾任富士康集团与Stellantis合资车用科技公司技术长暨副总经理,推动ADAS及智能座舱系统产品进入全球车用市场。纽约哥伦比亚大学电机博士,专精于机器学习、电脑视觉、自驾车、机器人等领域。为讯连科技研发团队创始成员,慧景科技(thingnario)共同創始人,NVIDIA AI Lab計劃主持人;曾任IBM华生研究中心及美国微软研究院客座研究员。担任多家科技公司AI策略顾问,习惯从学术与产业双重视角检验技术发展的机会与挑战。<br>
智能应用 影音