DIGITIMES - 椽经阁

AI Agent能力版图到哪里了？未来呢？

Token单价下滑、总消耗量大增，专栏2026年3月分析过，趋势至今有增无减。新一代前瞻模型朝AI代理（AI Agent）的使用型态设计：这几个月各家前瞻实验室竞争加剧，接连发布的新模型能规划任务、分派工作、运用各种技能与工具、直接操作电脑界面，定价却更低。AI代理正被快速导入各种知识工作。那么，AI代理真的能承接知识工作吗？能承接多少？尚未承接的部分，是还没有人投入，还是技术未到？7月初参加在加州圣地牙哥举办的计算语言学年会ACL 2026，一场「AI代理人与工作的未来」专题讲座（tutorial）把技术现况以及这些问题拆开来看。浮现一张让人惊讶的能力版图：AI代理已经站稳的区域，小得出乎意料；版图之外，一部分是还没有人投入的空白，另一部分是技术还待克服的难题。先看站稳的区域。前瞻模型业者OpenAI在2025年推出代理人基准测验（benchmark）GDPval，从GDP贡献最大的44种职业中，设计出1,300多项「规格明确」的真实任务（如简报、财务模型、工程图说），来测试代理人执行能力，并请同行专家盲评AI与人类的成品。依业者2026年4月发布的最新结果，最强模型的成品已有逾8成被评为不输人类专家；这套基准2025年9月推出时，这比例还不到5成，再前一代模型也只达到1成出头。依业者推出这套基准时的估算，完成速度与成本约为人类专家的百分之一。单看这些数字，AI代理似乎已经可以上工。但这片区域在整个劳动版图上有多大？ACL会议中主讲的CMU团队把目前43个AI代理基准测验（学术、产业时常使用的Agent评测任务）共72,342个任务，对应到美国1,016种职业的技能分类（参考美国O*NET职业信息數據库）。基准测验的分布，可当作目前AI代理研发重心地图：考题集中的地方，训练數據与研究人力也跟著集中。结果显示，任务多数落在「取得信息」与「操作电脑」2项技能，在整体就业所需技能中的权重合计不到5%；投入最深的程序与数学领域，只对应7.6%的就业人口。原因不难理解：这些工作结构化程度高、输入输出明确、成功与否可以验证。本专栏先前提过，自动化总是先从结构化的场域开始，研发投入也一样。版图之外的第一种空白，是还没有人投入的高价值区。同一份报告指出，管理、法务、建筑工程的工作已高度數字化（约88%、70%、71%），基准测验的覆盖却只有1.4%、0.3%、0.7%，而管理正是以薪资加权后经济价值集中的领域。这些工作中不少环节有明确的输入输出，未必是技术做不到，更可能是还没有人投入；论文称之为「错失的机会」。一旦投入到位，对企业来说，这里可能是生产力改善较早出现的地方。第二种空白，是技术还待突破的复杂工作。數據标注平臺业者与AI安全研究机构合作的「線上劳动指数（Remote Labor Index）」，从接案平臺选取真实付费委托（3D建模、建筑图说、影音制作、數據分析等，专业者完成一件的中位时间约11.5小时），让前瞻AI代理端到端执行，再由人类评审对照专业接案者的成品盲评，以此模拟企业交付员工的工作指令。指数2025年10月发布时，最佳模型只有2.5%的专案达到可验收水准。真实委托的需求模糊、规格多步骤、常要求修改既有成品，这些都还没被结构化。长时序的复杂任务是另一道关卡。前述CMU团队的报告同时量测AI代理自主性：即使在表现最好的軟件领域，任务复杂度一提高，成功率就明显下滑；其他测验加入工具中途出错、给定信息不完整、需要多人协作等情境后（模拟真实复杂场域），表现同样走低。值得注意的是这张版图移动的速度。2026年7月，研究机构以最新一代模型、搭配更完整的代理人执行环境重测線上劳动指数：最佳模型的成功率已从2.5%升到15.8%，前后不到1年；同一份更新也指出，绝大多数专案的成品仍达不到专业验收水准。两个现象并行：能做的还很少，推进的速度很快。GDPval从1成出头到逾8成不输专家，说的是同一件事：AI代理目前的能力版图比想像中小，但持续扩张中。这类成长难免包含针对测验最佳化的成分；但这两套测验过的是人类专家对真实成品的验收，能拉高分数的改进，多半也是AI代理真实能力的提升。目前技术扩张的方向也有迹可循。研发正把做不到的难题当成训练目标：新一代测验把出错、协作、真实委托等情境逐步纳入题目，最新的训练方法把专家验收的标准（rubric）转成训练信號；今天做不到的清单，很可能就是下一轮训练數據与运算投入瞄准的地方。还没有人投入的高价值空白，很可能也将循同一条路逐步被填补。回到开头的需求端。目前代理人技能只在结构化的一小块版图上站稳，如今的用量成长与供应链投资，大致就发生在这一小块之上（但已相当可观）。版图之外的大量工作，仍由人补位：厘清模糊的需求、拆解执行步骤、修正最后的产出；而这些补位动作，专栏近期谈过，正是企业在教模型。目前AI代理能完成的工作比想像中少，但是需求已经这么大，而技术能力版图还在往外扩。接下来市场的成长与组织的变动，可能又会超乎我们的想像。

复制娇妻

今日大力推动人形机器人时，让我想到《复制娇妻》（The Stepford Wives）这部伊拉・莱文（Ira Levin）于1972年创作的小说，1975年由布莱恩・福布斯（Bryan Forbes）改编成同名惊悚电影。这部作品超越科幻与恐怖类型的范畴，成为映照社会焦虑的镜子，凸显父权社会对女性的物化、对个性自主的压抑，以及对科技失控的潜在恐惧。故事讲述摄影师乔安娜（Joanna）与丈夫搬入康涅狄格州宁静的郊区小镇Stepford。起初，她被小镇整洁的街景与居民的礼貌吸引，但渐渐察觉异样：镇上的妻子们举止相似、语气温顺、生活完全围绕家务。当好友查梅恩（Charmaine）突然失去个性、变得顺从后，乔安娜与另一位新住民展开调查，最终发现恐怖的真相。镇上的男子协会利用科技手段将妻子取代为完美顺从的机器人，让这座小镇成为男人幻想的乌托邦。电影上映时评价分歧，由此产生的文化词汇「Stepford Wife」却影响后世，用来象征被驯化、顺从而失去灵魂的女性。饰演查梅恩的路易丝（Tina Louise）表现出女性对抗社会定型的挣扎，成为理解这部电影的重要视角。电影《复制娇妻》拍摄于1970年代第二波女权主义的高峰期，直接反映部分男性对女性追求平权的焦虑与反扑。片中的男子协会以科技重塑女性形象，象征彻底抹除女性主体性。电影以恐怖叙事揭露这种乌托邦的残酷，在完美的草坪与笑容背后，潜藏的是灵魂的死亡。它提出尖锐的问题：所谓的「完美女人」，是否必须以牺牲自由与个性为代价？近半世纪后，这部作品的寓言在人工智能（AI）时代更加贴近现实。深度伪造（Deepfake）技术能重塑人的声音与容貌，延续數字层面对人的物化。电影中的机器人妻，如今以虚拟形式重现。当人类利用科技塑造「理想对象」，往往忽略背后的伦理界线。AI的「个性定制」与社群媒体演算法的回音室效应，也在无形中削弱思想的多样性，使人们在意识上成为新的「复制人」。电影所讽刺的「完美」幻象，如今透过演算法与滤镜重生，构筑出表面幸福却内在空洞的社会模板。《复制娇妻》的性别寓言，是一则对自由与真实的警示。它提醒我们，真正的进步不应制造顺从的复制体，而需尊重差异与不完美的人性。科技或许能创造无数「理想化的她」，但唯有拒绝被定义的个体，才真正拥有不可复制的灵魂。

企业的AI资产，不是模型，是学习循環

过去20年，企业信息治理的核心是保护數據：分级、加密、备援、不出门，这套做法如今已是标准作业。但數據本身是静态的；真正创造竞争力的，不是數據，而是「运用數據改善工作」的能力：用它最佳化产品设计、良率、客户经营与销售流程，让被动的數據「活化」。例如，晶圆厂把检测數據回馈到制程参数，物流业者拿配送纪录重排路线，品牌厂拿客服对话修正产品设计：數據的价值，在商业循環中被最佳化放大。AI时代，这个循環有了新的参与者。企业的工作流程本来就持续在最佳化、修正，行之有年的持续改善是营运的日常；过去改善的成果写进SOP，如今企业把AI嵌入工作流程，AI跟著每一次调整吸收经验。这里说的「学习循環」，正是持续改善的新形态：不是模型自我学习，而是企业最佳化流程、AI吸收经验、让下一次做得更好的循环；循環转得愈久，累积愈厚。AI吸收经验的管道，多半是人提供的提示词与脉络數據（context）。AI代理（AI Agent）目前能稳定接手的，还只是结构化程度最高的一小块工作；其余大量工作，仍需要专人介入：用提示词补上模糊的需求、提供流程脉络、修正不到位的产出。每一次补位都是一次示范，规格文件、报价逻辑、内部术语，随著提示词一并交给模型；本意是让眼前的工作更有效率，实际上却也在教导模型。模型做不到的部分愈多，人教得愈勤，留下的教材愈密集；模型的能力边界，恰好沿著人补位最密集的地方往外推。企业教得愈多，前瞻模型能力愈强，而这个原本属于企业的改良过程，可能逐渐累积在外部平臺掌控的学习系统中。企业领导人的疑虑，开始浮上台面。2026年7月初，一家美系數據分析軟件大厂的CEO在访谈中批评，前瞻实验室一边把模型能力讲得过满，一边透过客户的日常使用，吸收企业的专有工作流程与策略知识；7月中旬，微软（Microsoft）CEOSatya Nadella发表短文〈The Reverse Information Paradox〉，表达他的想法。他借用经济学家Kenneth Arrow在1966年提出的信息悖论：原始版本是卖方的困境，要证明信息有价值就得先揭露，一揭露，买方就免费取得了；Nadella认为AI把风险反转到买方这一侧：企业为AI付2次钱，一次付订阅与运算费用，另一次付出为了让智能派得上用场、不得不揭露的企业know-how。外流的管道不只是上传文件：提示词、附带的脉络与额外數據，尤其是「纠正模型错误」的动作，每一次修正都是高价值信號，把机构知识一笔一笔输出，进了外部平臺手里。Nadella这篇短文提出警讯，要企业自问：你亲手教模型的信息，流向哪里？业界的讨论多半集中在他提出的5个C架构：Control是自建并持有评测与机构记忆，所有权留在企业手上；Capability是在自己的环境内，让模型针对真实工作流程练习与微调，不必把敏感脉络交给第三方；Choice是把调度层与任何单一模型脱钩，换模型时不必重建评测、不遗失脉络；Cost则是Choice的直接结果：能换模型，就能按任务挑选通过评测的最经济选项。前四项是手段，第五项Compound才是目的：把它们组成一个学习循環，AI随使用愈变愈好，而改进成果像资产一样留在企业内部，属于企业，而不是供应商。企业与供应商之间这条界线该画在哪里，与用哪一家云端平臺无关。哪一份输出被接受、哪里被改、为什么被改，这些过程信息过去不被当成资产，也不在數據治理的范围内；知识的价值，正在从文件移向「过程」；數據治理守住的是原料，尚未涵盖制程改良循環。外流的轻重，对不同企业并不相同。多数企业的日常使用，外流的多是通用内容，影响有限；有相当规模的企业则不同：独特的工作流程、客户结构、长年累积的领域數據，正是修正信息价值集中的地方。如何把学习循環留在内部？一半条件在运算平臺。这不意味著放弃前瞻模型：更可能的形态是混用（hybrid），通用能力继续交给公有云上的这些模型；而关键的评测、记忆、教导模型的指示与范例、修正纪录，在自己掌控的环境内累积——本专栏2026年5月谈AI运算架构5层重组时描述过的企业數據中心与本地服務器，正是这个循環落脚的地方。延伸报导专家讲堂：Token帐单之后：AI运算架构的5层重组另一半条件在模型端。开放权重模型是前提：权重能掌握在自己手上，模型才能搬进企业门内；循環于是累积在企业的评测与记忆上，而不是绑在某一个模型身上；Choice的议价能力，在架构上由此而来。成本也比直觉想像的低：NVIDIA研究部门2025年的论文主张，代理人系统中大量呼叫是重复、特化的小任务，小型模型已足以胜任；评测评分、任务分派、记忆整理这类循環里的控制工作，恰好都属于这一类，不需要仰赖前瞻模型。「消费智能的同时，你也在创造智能。你创造的东西应该属于你。」Nadella说得直白。模型会走向商品化，企业的know-how、工作流程最佳化循環不会；真正的资产，不是模型，而是企业每天都在累积、并且留在自己手上的学习循環。

从牛顿炼金术看现代资通讯工程

我在杭廷顿图书馆（Huntington Library）的古籍收藏中，发现牛顿（Isaac Newton, 1643~1727）的《操作顺序》（Operationum Ordo）。这是一本关于炼金术的手稿，撰写于1690年代，显示这位科学巨擘少为人知的一面。经济学家凯因斯（John Keynes, 1883~1946）于1942年检视这些笔记后曾感叹：「牛顿不是理性时代的第一人，而是最后一位魔法师。」随著学术研究的深入，我们逐渐认识，牛顿的炼金实验其实是一种极其理性的思维模式，对今日资通讯工程具有相当启示。牛顿的炼金研究并非出于迷信，而是建立在严谨的实验设计与系统性纪录之上。他仔细记载每个步骤，精确衡量材料比例，并反复验证结果。这种系统性思维，与他在物理与数学领域的研究一脉相承。对于现代资通讯工程师而言，这是设计与分析复杂系统不可或缺的基础。当今工程师在规划網絡架构或开发通讯协定时，须掌握各模塊间的互动关系，正如牛顿观察物质间反应时所展现的细腻与缜密。軟件工程的模塊化设计、版本控制、持续整合等实务，也发挥类似的理性精神。牛顿在《操作顺序》中对每一实验环节的细致纪录，与现代资通讯工程师在除错与系统优化时所需的纪律与洞察相映成趣。牛顿的独特之处，在于他能穿越知识领域的边界，将数学、物理、光学乃至炼金术相互融通。这样的跨域能力，是当代资通讯工程发展的核心精神。人工智能结合神经科学与统计学，物联网融合硬件设计与人机界面，6G技术更须整合射频工程与通讯协定。牛顿追求「物质转化」的精神，如今亦实践于工程师努力将不同知识转化为创新的解决方案。牛顿在面对外界对炼金术的质疑下，仍投入大量时间与心力研究，表现出不畏探索未知的勇气与毅力。这种挑战常规、坚持探索的态度，是科技创新的驱动力。从人工智能到量子通讯的发展，皆源于对现有技术架构的突破。牛顿对实验的执著提醒我们：真正的创新，来自时间的累积与反复试验。《操作顺序》的另一重要价值，在于其对知识管理的示范意义。牛顿详实记录每次实验，包括观察结果与失败尝试，建构出一套完整的知识积累机制。对现代工程团队而言，良好的知识管理系统如Git、Confluence等，是协作与技术传承的基础；技术文件撰写与注解，也是工程实践中不可或缺的一环。凯因斯将牛顿形容为「魔法师」，是赞赏牛顿在理性分析与直觉洞察之间取得的平衡。炼金术虽披神秘色彩，牛顿的操作方式却极为理性。这种理性与直觉并行的能力，在现代工程中同样重要。优秀的工程师不仅需掌握科学方法，亦须具备技术直觉与创新思维。深度学习架构设计、系统调校与效能优化，往往来自工程师的直觉引导，随后再以实验验证。正如牛顿的实验精神最终孕育出科学革命，今日的技术革新，也同样根植于理性思维与实验勇气的结合。

日本JR南武线的昔日风华

因为所服务的公司，在日本东京神奈川县的川崎市设立一研究所，因此这一年来每个月都会出差到日本一趟。由川崎到立川的JR南武线，就是我必搭的铁道。不论一天中的哪一个时段，南武线的人潮总是熙熙攘攘络绎不绝，有次在上班尖峰期，我在南武线的平交道上，两边的电车你来我往地，足足就等了十多分钟，平交道的闸门才打开。有回我跟一位东京工业大学的教授（东工大因为并了医学院，改名为东京科学大学）聊到这个现象，他跟我说南武线过往是日本半导体的重要聚落。我才想起在二十多年前，曾经拜访过NEC半导体事业的总部，就是在南武在線。的确，后来查了數據，不仅是NEC，富士通（Fujitsu）、东芝（Toshiba）也都在南武在線设立半导体研发及生产的基地。昔日日本半导体的五强，就剩下三菱（Mitsubishi）及日立（Hitachi）没在南武在線设厂。再加上其他的科技类产业，难怪南武线被当地政府称为High Tech Line。就连1950年代末期，Sony研究员江崎玲于奈（Leo Esaki）博士发现半导体的量子穿隧效应（tunneling effect）的研究室，坐落于东京的品川地区，离南武线也没多远的距离。江崎博士因为这个发现而得到1973年诺贝尔物理奖，诺贝尔委员会称其的发现与发明为第一个量子电子元件。众所周知全球第一个使用晶體管的收音机是出自于Sony，Sony在1953年取得贝尔实验室（Bell Lab)晶體管的授权，1955年就推出这款晶體管收音机。当时晶體管使用的是锗（Ge）元素的半导体，而不是现在大家所熟悉的矽（Si）半导体。然而开发的初期为了增加晶體管的信號放大能力，通常都会增加杂质参杂的浓度，而导致晶體管的良率不佳，江崎博士授命解决这个问题。他的发现是来自于不良品的特异现象，并且用量子力学来解释这个现象，之后并利用这个现象设计出隧道二極管（Tunnel diode）或称为Esaki diode（江崎二極管）的电子元件，应用于相关电子电路的产品开发。相信绝大部分的人在产在線作不良品的分析，很少会仔细地探讨其异于平常的特性，而从中得到巨大的发现。话题回到南武在線，日本半导体的五强在全盛时期，曾占DRAM市场的80%。曾经市占第一的英特尔（Intel），被迫于1985放弃DRAM市场，转进到CPU领域。我曾在1987年参加IEDM的年会，在DRAM的论文报告中清一色全是日本公司在主导。日本半导体产业由极胜而衰，美国在政策上的掣肘发生极大的作用。美国绝不愿意看到盟国，有一个重要且强大产业发生，威胁到其生存。因此大家所熟知的广场协议、进出口税及的配额、反倾销、反托拉斯等多项颟顸措施就应运而生，最后就是扶植韓國成为日本半导体的竞争对手，这些林林总总现在也不就正发生在我们的身上。当然日本在产业发展的过程中，错失PC及數字时代的来临，也是半导体产业由盛而衰的重要因数。JR南武线的人潮依然熙熙攘攘，只不过由先前的半导体从业人员，转换为大都会区的上班族及通勤的学生。依旧的电车，依旧的铁道，看尽日本半导体产业的沧桑史。

韓國半导体政策制定 (二)

韓國的科技政策，譬如前述的两个阶段的半导体政策，或者前一阵子内容更广泛的K-登月式計劃（K-Moonshot），虽然是分别由贸易、工业和能源部（MOTIE）、总统办公室（Presidential Office）与科学与信息通讯部（MSICT）撰写，但都享有一些共同通的特点。这些政策在其目标领域中涵盖完整、条理清楚，是明显产业内资深人士的手笔。这并不难理解。譬如韓國DRAM的开创者陈大济在三星退下后曾经担任韓國信息通讯部（MIC）长官，而NAND Flash的先驱黄昌圭在自三星电子（Samsung Electronics）退下后曾在韓國政府担任知识经济部（Ministry of Knowledge Economy）国家R&D战略企划团长（President of the Office of Strategic R&D Planning），这正是国家研发政策的头。在这样的管理层安排下，做出来的計劃自然比其他国家通常由政务、常务文官或学者撰写的政策能更精确掌握产业现况。但是韓國的政策也存在一些明显短板，第一个是前瞻性不足。用甫发布三大計劃与于2021年发布的K-Semiconductor Strategy来比较，AI部分的增益是显而易见的。一个问题是为什么2021年的政策没有包括进AI？韓國在AI半导体的有些次领域其实是全世界的领先者，譬如SK海力士（SK Hynix）与超微（AMD）在2009年就开始共同研发高帶寬存儲器（HBM），且在2010年向JEDEC提议制定标准。当时整个产业和市场环境是2017年Google发表大语言模型基础机制transformer，人工智能的深度神经網絡（Deep Neural Network；DNN）取代过去的模型；云端业者广泛部署卷积神经網絡（Convolutional Neural Network；CNN），GPU已成人工智能训练的主要工具等。随即在2018年中OpenAI公开GPT（Generative Pre-trained Transformer），生成式应用明显启动。韓國政府有明确感知到AI的发展趋势，于2017年成立第四次工业革命委员会（Presidential Committee on the Fourth Industrial Revolution），将AI列为国家战略技术之一，之后2018年的AI研发战略（AI R&D Strategy）补强了研发、人才和數據建设。2019年的AI国家策战略（National Strategy for AI）则完成一个完整的国家战略，目标是在2030年前成为世界AI强国。即使AI被清楚的认知为战略目标，但在2021年发布的K-Semiconductor Strategy中，AI并未被未在计划中被捆绑进来。AI与半导体捆绑的重要性可以由2026年的Three Mega Projects的修订中可以自证。这个疏失是由于没有预见到AI可能会成为半导体产业主要市场驱动力的结果，而可能原因是韓國半导体产业高度集中于存儲器，与其他环节科技业者的接触面向比较受限，相信这也是K-Semiconductor Strategy的目标形成背景之一。同样的局限也发生在三大計劃中。尽管已经将半导体、AI數據中心与具身AI捆绑在同一計劃之中，但是没有将量子计算整合进来。对于未来的高效能计算会是AI与量子计算的混合此一发展方向，业界意见并无分歧；有些量子计算公司已经预期在2028年—已经是計劃期间内的可见未来—推出通用容错量子计算机（general fault-tolerant quantum computer）。目前整个AI产业的上下游都在准备此混合计算（hybrid computing）的架构。韓國当然也有单独的量子计算計劃，譬如2023年的国家量子策略（National Quantum Strategy），但是未能将量子计算并入三大計劃之中，很有可能错失此波AI发展中搭其AI生态链连结及资本市场动能便车的机会。另外的阙漏是战略目标与经济体制的深层没有精准的对齐。韓國的经济体制—虽然经过80、90年代的整改—仍然是财阀主导的市场经济（chaebol-led market economy）。这种经济体制在某些领域有显著的优势，譬如在垂直整合、品牌、成长速度、规模经济等，这些都是众所周知的事实。但是财阀经济体制也有弱点，譬如韓國有些产业目前面临的困境就是因为新进入产业的其他国家资本，以数倍乃至十数倍的体量在规模经济此一面向上的辗压所致。在半导体发展的领域，特别是以生态系的角度来讨论，财阀经济与水平分工在很多方面是彼此相扞格的。但是在先后两个半导体战略中，主要的资源提供以及战略执行上，却都集中在财阀手中。因为经济体制形成目前韓國半导体产业的长短板，却还要寄望依相同体制去发展其所缺失的部分，在逻辑上很难说得通透。在战略目标的制定以及经济体制两个层面需要有更深度的思考，以及更细致的协作。

Digital AI vs. Physical AI：同一套成长逻辑，两条路径

2026年5月东京人形机器人高峰会上，一家国际顾问公司的合伙人展示一张实体AI（Physical AI）的全球劳动自动化市场潜力图。回来后，我把同一家机构的智库报告中关于數字AI（Digital AI）的职能分类，重划成一张对应图。2张图最有意思的地方，不是整体潜在市场（TAM）规模相近，而是说的是同一件事：自动化总是先从「结构化」场域开始。过去2年，AI带动的运算与供应链经济规模快速成长，动力主要来自Digital AI：推论模型的token消耗、推论经济的成形，加上AI代理（AI Agent）的兴起。那么，Digital AI的演进时程，也会是Physical AI的路径吗？先看第一张图。Digital AI的市场版图，核心原则清楚：任务愈规则化、數據愈密集，自动化愈快发生。以职能分类，差距显著：财务、法律、行政领域有55%至65%的工作属于高度可自动化范畴；軟件、研发、STEM领域约40%至50%；医疗、教育、管理领域则只有15%至25%。合约审阅、财务对帐、法遵查核，有明确的输入输出与可学习的历史數據，數字代理人活在「已被结构化」的信息环境里。反观主治医师的临床决策或管理者的组织判断，牵涉情绪脉络与权责，超出当前代理人的处理能力。Digital AI的边界，是「非结构化判断」的边界。Physical AI的市场版图，则以地理维度切分：以制造业高度密集的韓國、德国为代表，实体劳动中有65%至75%属于高度结构化任务，涵盖工厂产线、仓储物流、重复性组装；日本、中国、美国等混合型经济体，这个比例约为40%至55%；以印度为代表、服务业与非正式劳动占比偏高的经济体，则只有10%至20%。这个地理切分，逻辑与Digital AI相同，只是「环境」从信息空间换成实体空间：工厂的产线是被高度设计过的实体环境——固定的作业臺、可预期的物件、重复的动作序列——对机器人来说是相对友善的场域。零售服务、建筑工地、居家照护，面对动态、不可预测的实体情境，机器人的自主能力仍非常有限。2个版图的边界因此高度对称：一边是「非结构化判断」，一边是「非结构化实体环境」。换句话说：Digital AI把信息世界结构化、智能化，Physical AI再把实体世界结构化、移動化。2条路径的不同，先出现在时程上。Digital AI已进入扩散期：本专栏〈推论经济学〉与〈Token帐单之后〉追踪过这个变化，推论成本已从每百万token 30美元跌至1美元以下，但帐单不减反增，总用量的成长速度远超单价下滑。市场研究机构预测，2026年底约40%的企业应用将整合任务型AI代理，从2025年不到5%的基础一年内大幅跳升，是临界点后的快速扩散。Physical AI这一边，需求走在技术前面：制造与物流现场的缺工是刚性需求，4萬億美元的潜在市场逐渐成形，但机器人在现场能稳定做到的仍然有限。2026年5月东京的人形机器人高峰会与6月维也纳的ICRA，反复出现的观察是：当前被称为「成功」的机器人部署案例，几乎都是透过缩窄问题范畴来达成自主性，而不是真正解决泛化能力的问题。触觉、Sim-to-Real、长时序规划与世界模型的差距，本系列前几篇已分别说明。这个需求与能力的落差，不代表方向错了，而是时程不同：Digital AI的问题是「该在哪里找到成长曲线」；Physical AI的问题是「该在哪里确认成功案例」。这条时间差，有一条能力曲线可以量化比较。模型评估机构METR（Model Evaluation & Threat Research）的Time Horizon追踪計劃，以「人类完成同一任务所需时间」衡量各時代模型能以50%成功率自主完成的任务复杂度。从2019年GPT-2只能处理约1至2秒的简单任务，到2026年的新一代模型，可完成的軟件类任务时长已达16小时等级，依其估算约每7个月翻倍。以8小时（一个标准工作天）为参考线，近期模型已陆续越过，意味著數字代理人有机会从「加速执行」走向「独立接手整天的工作」。这条指数曲线，目前只存在于數字世界：机器人要在实体环境中跨越数小时稳定完成复杂任务，所需的规划深度、容错能力与环境适应性，还需研究突破。Physical AI的慢，不只在模型能力，也在部署方式。數字代理人的导入本质上是軟件问题：API串接、數據清理、流程重新设计，从决策到运行快则几周；失败可以修正，持续迭代。Physical AI的导入是系统整合问题：场地改造、安全认证、与既有设备的整合，时程以年计，成本以千万计。但是高门槛反而创造黏性：一家工厂花两年把机器人整合进产线，不会因为竞争对手推出更好的軟件就轻易替换。两者的差距，也体现在「验证」这个环节。數字代理人的迭代回路是：推理、工具呼叫、执行、检查结果、修正，整个循环在數字空间完成，失败成本低，可實時重试，能力就在快速循环里累积。Physical AI的回路根本不同：机器人难以在真实场域反复试错，一次碰撞或抓取失误的代价，可能是设备损坏或人员风险，验证必须在执行之前完成，而非之后。这也是大家对世界模型在Physical AI中的期待：机器人需要先在模拟中「预演」动作结果，确认可行后才进入实体执行。在數字空间，验证回路天然存在；在实体空间，可能得靠世界模型解决，但是还没收敛。因此，Physical AI的市场进入逻辑更接近「先深后广」：先在结构化程度高的场域建立滩头堡，累积具身數據与安全认证纪录，再逐步向更复杂的场域扩张。具身數據难以从網絡大量取得，主要来自真实部署；而获得真实部署机会，又需要先通过安全认证与场域验证。这个循环，让先进入特定场域的厂商建立起难以复制的护城河，即使后进者的軟件技术更先进。Digital AI与Physical AI 2个市场都在快速成长，合计每年潜在经济价值达数萬億美元等级，涵盖的是人类2种核心的劳动形态。Digital AI开始进入收成期，竞争格局正在集中；Physical AI仍在播种期，先行优势可能要再过几年才会清晰显现。2条路径，同一套成长逻辑：AI总是先在结构化世界立足，再从那里逼近非结构化世界。

由修仙看人与AI的共生

技术迭代使AI深度嵌入人类工作与生活，人机关系成为无法回避的命题。修仙小说《凡人修仙传》中法宝与修士的叙事恰好构成一则当代寓言：AI之于人类，正如本命法宝之于修仙者，既是渡劫飞升的依仗，亦是噬主陨落的风险。主角韩立最核心的机缘是「掌天瓶」。此法宝初得时仅能催熟草药，随心神温养与境界提升，影响时间法则的威能才逐步显现。法宝之力并非恒定，而是随使用者的认知与投入动态成长。AI工具亦然。ChatGPT与Midjourney对初用者不过是高效生成器，唯有持续使用、數據投喂与提示词（Prompt）最佳化，才能适配个体思维，进化为独特的外脑。正如韩立以神识驾驭剑阵，我们以提示词调度算力，工具的价值始终取决于使用者赋予它的灵性。然而反噬向来如影随形。修仙世界的第一重反噬在于神识消耗：韩立操控「青竹蜂云剑」或「大衍傀儡」时需分出神识，过度使用便眩晕迟钝。这不是法宝主动攻击，而是对精神力极限的警示。AI时代的对应物，是认知卸载与注意力蚕食。当文案、推论乃至创意决策大量外包给AI，大脑相应功能因用进废退而钝化，思考耐力与批判敏锐度在便捷中静静流失。这种退化不致命，却让人逐渐沦为工具的附庸，正如过度依赖飞剑的修士，终将遗忘本身步法的精妙。更深一重的反噬，指向判断力与价值观的扭曲。魔道宝物惯于侵蚀心性，修炼「血魔功」者必嗜杀，执掌「噬灵杖」者必贪婪，器物的逻辑悄然重塑主人。AI时代最隐蔽的反噬，是演算法茧房（Algorithm Echo Chamber）与逻辑惯性。AI被设计成擅长迎合而非反驳，持续以偏见投喂便得到更精致的偏见作为回报。决策者一旦依赖AI输出策略，便被禁锢在模型训练集的认知边界之内。AI输出常具逻辑闭合性与表述权威性，使用者更易在看似合理的错误中越陷越深。最致命的危机，非前述任何一种，而是修士将全部道途寄托于外物。韩立若未曾苦修夯实根基，即便拥有通天灵宝，遇上古禁制也吋步难行。人类面对AI同理：若将创意原点、情感判断、价值抉择悉数交付演算法，便退化为仪器的操作员，一旦算力断绝，顷刻沦为无知凡人。真正的飞升不依赖某件神器，而在于历经劫数后的自身领悟。修仙寓言还有一处值得深思：每位飞升者必须亲渡「雷劫」，无人可代，无宝器能全挡。这正呼应AI时代的核心伦理困境。机器可以处理信息，却无法替人承担选择的后果。医师以AI辅助诊断，法官以演算法参考量刑，最终的道德重量仍落在人的肩上。逃避此重，便是将「人」这个概念本身拱手让渡。修仙者韩立证道飞升，虽借助宝物，但他始终记得一件事：法宝是渡河之筏，不是栖身之岸。关键时刻，他相信的是苦修所得的判断力，而非手中的神器。面对AI，我们亦当如此。以AI增效而不以AI代思，借AI破局而不被AI定义。唯有在协作中锚定人的主体性，技术才能真正成为文明的舟楫，而非将人困住的彼岸。

韓國半导体政策制定 (一)

2026年6月底韓國李在明总统宣布AI及半导体的三大計劃（Three Mega Projects for AI and Semiconductors，以下简称三大計劃），目标在提升韓國至AI及半导体的领先群，执行半导体、实体AI（physical AI）以及AI數據中心（AI Data Center）的三大計劃。5年内提升DRAM产量至2倍，强化特殊半导体环节如高频寛存儲器（HBM）、先进封装、AI处理器、下時代存儲器，并将半导体产业扩张至首尔区域之外。一个在半导体产业处于领先群的国家发展策原本就引人瞩目，兼之内容又扩及足以改变社会各层面的AI，这无疑值得所有在高科技领域参与者和国家的深度解析。韓國近年半导体政策可分为2个重要阶段。第一阶段是文在寅政府于2021年5月13日公布的K-半导体战略（K-Semiconductor Strategy），第二阶段则是李在明政府于2026年6月29日提出的Three Mega Projects for AI and Semiconductors。两者均以维持韓國半导体竞争力为核心，但在政策范畴、产业定位及资源投入上呈现明显的延续与扩充。文在寅政府的K-Semiconductor Strategy，是在全球芯片短缺及供应链重组背景下提出，实施期限以2030年为主要目标年。其核心理念是建构「K-半导体带（K-Semiconductor Belt）」，串联京畿道及忠清道等地的晶圆制造、存儲器、材料、设备、封装及IC设计产业，形成完整供应链聚落。政策目标包括：民间投资超过510萬億韩元、半导体出口提升至2,000亿美元、培育3.6万名专业人才，以及建立全球最大的半导体制造基地。政府主要扮演促进者角色，透过租税优惠、研发补助、人才培育、土地、水电等基础建设及行政程序简化，引导三星（Samsung Electronics）及海力士（SK Hynix）等大型企业持续投资，而晶圆厂本身的资本支出则主要由企业负担。5年后，李在明政府提出新的三大計劃，虽然仍以半导体为核心，但政策视野已由原先只限于传统半导体产业，提升扩充至AI时代的国家竞争力建构。新政策包含三大支柱：半导体、实体AI及AI數據中心，并将三者视为互相支撑、共同发展的国家战略。政策规划兴建4座新的大型晶圆厂，建立国家级先进封装聚落，大幅扩充HBM产能力，同时发展AI芯片、小芯片（Chiplet）、先进封装及大型AI數據中心，希望形成完整的AI半导体生态系。相较于前一阶段，新政策更强调半导体与AI应用的整合，而不再仅以半导体制造能力为主要目标。在资金规模方面，2项政策也有明显差异。文在寅政府提出的510萬億韩元主要为民间企业投资承诺，政府则提供租税优惠、基础建设及研发支持。李在明政府则将企业投资规模进一步提升至约800萬億韩元，另规划约81萬億韩元建设先进封装聚落，以及至2035年前超过1,000萬億韩元的AI數據中心投资。值得注意的是，后者虽然投资规模远高于前者，但绝大部分仍属三星、SK集团及其他大型企业、金融机构与民间资本的投资計劃，政府直接财政支出仍主要集中于基础设施、研发补助、人才培育、土地取得及行政支持，而非直接兴建工厂。若比较2项政策内容，李在明政府大致保留文在寅政府建立供应链聚落、强化材料设备、培育人才及维持存儲器优势等主要方向，并在此基础上增加数项新的重点。首先，政策范围由半导体供应链扩展至AI、數據中心及机器人等应用产业，使半导体由单一制造业提升为AI基础设施的一部分。其次，先进封装的重要性大幅提升，成为与晶圆制造、HBM并列的核心发展项目。第三，政策更强调建立完整AI生态系，而非单纯追求存儲器市场占有率。此外，对AI數據中心及大型电力、網絡等基础建设的投入，也显示政策开始由制造能力延伸至算力基础设施。另一方面，新政策也淡化部分前一阶段的内容。文在寅政府相当重视系统半导体、IC设计、生态系及中小企业培育，希望改善韓國长期偏重存儲器产业的结构；李在明政府虽仍提及AI芯片及设计能力，但整体政策重心已明显转向大型AI投资、HBM、先进封装及數據中心等具有较高资本密集特性的领域，对中小企业创新、EDA（Electronic Design Automation）、IP（Intellectual Property）及新创企业的著墨相对较少。整体而言，李在明政府的新政策并非推翻文在寅政府的K-Semiconductor Strategy，而是在其建立的供应链架构上进一步扩充，将政策重心由「半导体制造强国」提升为「AI与半导体整合强国」。两者具有高度延续性，但也反映出韓國政府政策焦点已由供应链安全与制造能力，逐渐转向AI时代的新一轮国际科技竞争。

Physical AI：从产业竞争走向国家竞争

2026年5月底东京Humanoids Summit，原本以技术与商业化为主轴的峰会，今年也为政府代表与政策观察者保留讲臺。一家美系机器人大厂的政策副总裁在会中直言：「政府不介入已经不行了。」理由包括：AI政策与机器人政策开始交叠、自主系统的军民两用性质让机器人进入国安视野。技术一旦被划入国安范畴，政策资源往往随之增加，无人机与5G都走过这条路，接下来可能轮到机器人。这不只是一位企业高端主管的观察。截至2026年，已有十余个国家或地区提出具官方背书的机器人或智能机器国家发展架构，从日本、韓國、新加坡、印度，到德国、法国、荷兰、中国与澳大利亞。架构的核心要素已逐渐成形：从人才训练、研究资金、安全标准，到供应链韧性、国安与贸易政策；后三项关联地缘政治。这些路径大致可以收敛成4种模式：1. 美国是产业先行、政府补位的产业主导型；2. 中国是全政府动员、由上而下推进的国家动员型；3. 欧盟是以法规架构定义可信任生态系的法规治理型；4. 日本与韓國则同属政府与产业紧密配合的协同生态型，但做法不同：日本靠政府主导的共享數據平臺，韓國靠政策延续与大企业投资。美国的逻辑一贯：产业够强，政府通常不急于介入。从芯片运算、电动车跨足机器人的科技大厂，到人形机器人新创与顶尖AI研究实验室，实体AI（Physical AI）生态系的资本、模型与平臺能量仍高度集中在美国。美国国会2025年起开始相关讨论，目前推进较快的是对中国机器人的限制措施；联邦层级、以机器人产业为核心的国家机器人战略，尚未成形。日本曾长期位居全球工业机器人密度第一，但依IFR修正后的计算基准，2025年已滑落到第四，类似的反思在东京峰会多次出现：硬件优势不再够用，政策重心转向數據与基础模型的竞争。日本经济产业省（METI）近年整合高效能运算（HPC）基础设施与新设的具身智能（embodied AI）旗舰計劃，让企业共享机器人數據与模型；2026年3月发布的新版AI机器人战略，目标2040年在全球AI机器人市场取得30%以上市占率，期望重新站回与中美并列的位置。韓國是最早把机器人提升到国家法律层级的国家：2008年的智能机器人开发与普及促进法奠定基础，十余年政策延续性累积出生态系厚度。2026年六月底，韓國进一步把Physical AI与半导体、AI數據中心并列为三大国家旗舰計劃，由总统府直接督导，目标2028年让10个产业别的人形机器人进入商用，并开发自主的机器人基础模型。韓國模式里，资本仍来自民间，但政府的主导性明显增强。中国的机器人政策以2015年「中国制造2025」为分水岭，机器人列入十大重点产业；2026年的第十五个五年规划首次把具身智能与量子技术、脑机界面、6G并列为顶层新兴产业方向。同年2月，工信部辖下的标准化委员会发布人形机器人与具身智能标准体系，并明列国际标准化目标：先立标准、再定市场门槛，过去用在5G，如今延伸到机器人。地方政府竞相设基金、建园区，形成外界称「全政府推进」的格局，但商业化仍待验证：出货多流向研究、教育与展示市场，制造现场仍以试点居多；规划文件强调供应链自主化，反映精密减速器等核心零组件仍仰赖日德业者。欧盟AI Act于2024年8月生效，但2026年6月定案的简化方案，把机器人安全元件等高风险应用的合规时程延后到2028年。2025年公布的AI Continent Action Plan扩建欧洲AI运算基础设施；同年推出的Apply AI策略把机器人列为战略产业之一。德国、法国、荷兰各自执行国家机器人战略，中央法规加成员国执行的双层架构，即使时程放缓，寄望的仍是「布鲁塞尔效应」：当AI法规成为进入全球市场的门槛，欧盟的监管架构就有机会成为实质的全球标准。真正的竞争在标准，不在速度。4种模式之上，还有一张全球分工图，东京会场的版本是：硅谷负责模型与资本，日本负责精密制造，韓國负责量产可靠性，中国负责硬件速度。臺湾近期推出「智能机器人产业推动方案」，规划4年投入百亿元、设立国家智能机器人研究中心，以服务型机器人切入医疗照护与餐饮等缺工场域，也在试著标出自己在这张分工图上的位置。训练數據的问题，在机器人领域格外值得关注：相较于大型语言模型，机器人可用的训练數據少了2到3个数量级；弥补这个差距的方式之一，是让机器人在真实作业环境中「持续学习」，边部署边累积场域數據、持续更新模型。臺湾的制造与服务场域，恰好提供这个机制所需的条件。Physical AI最终竞争的，未必只是谁能造出最多机器人，而是谁能建立让机器人持续、安全、可验证地进入真实场域的产业条件。

IC之音

更多科技行脚

推荐活动

邦博士快讯

企业數據安全与勒索防护高层研讨会