当一支铅笔的颤抖,遇见亿万参数的沉思
左图是我的手,右图是AI的灵魂,或者说,是它从人类无数个灵魂中蒸馏出来的回应。这件事让我著迷许久。起初,我只是随手在纸上勾勒一个女性的姿态:头部后仰,双臂上举,身体的弧度像一个无声的感叹号。线条粗糙,比例也不完美,但那个姿势里有某种说不清楚的渴望,像是一个人在黑暗中向天空伸手的瞬间。我把它拍下来,输入一段精细的提示词(Prompt),然后交给AI。几秒钟后,右图出现了。我盯著屏幕看了很长时间。那还是我的姿势,我的构图,但那个向天空伸手的女人,已经不再是草稿。她的头发像墨水在水中散开,一丝一缕都有自己的重量。她的皮肤在炭笔(Graphite)的阴影里呼吸,光从不可见的地方打来,让锁骨下方有了深度。最让我震惊的是那些紫色的牵牛花,它们并非强行安插,而是像真的从她的身体里生长出来,藤蔓沿著腰线缠绕,叶片覆盖本来空白的下半身,像是自然界对一个姿势的诠释。要理解这幅图从何而来,得稍微走进AI的思维逻辑。AI首先透过视觉编码读取草稿中的线条结构,同时解析提示词的语义,将两者在潜在空间(Latent Space)中进行多模态融合。接著,它识别出头部后仰、双臂上举的骨架,透过ControlNet确保生成结果严守原始轮廓,再从训练數據中召唤素描技法与新艺术运动(Art Nouveau)的视觉记忆,将它们揉进同一个画面。最核心的演变发生在扩散过程(Diffusion Process)里:图像从一片纯粹的随机噪声出发,在逐步去噪中让细节从虚无中浮现,像是某种沉睡的记忆在黑暗中缓缓苏醒。那些牵牛花之所以长在那里,是因为交叉注意机制(Cross-Attention)让花卉的语义在图像特定区域精准激活,而ControlNet那双无形的手,始终拉住AI奔涌的想像力,让它不越出我草稿划定的物理边界。整个过程,像一位艺术家在高维矢量空间中进行的联想,素描的肌肉记忆与牵牛花的印象在同一瞬间翻涌交叠。那幅右图太美了,美得让我有一瞬间觉得左图显得有些多余。但我很快意识到,如果没有左图,右图根本无从谈起。AI的所有聪明,在那一刻都在服务我那个颤抖的轮廓。那个姿势是我的,那个渴望是我的,AI只是给了它一场盛大的赴约。这就是人机协作最迷人的地方:不是替代,而是放大。我带来意图,AI带来技法;我带来情感的骨架,AI带来血肉和皮肤。工具在改变,从兽骨到毛笔,从油彩到潜在空间中的运算,但那个想要表达某件事的冲动,仍然是整件事的起点,也是任何参数都蒸馏不出来的精华。
AI Token耗量持续攀升—推理模型的崛起与产业重塑
2022年下半,AI技术出现罕见的结构性转折。Frontier Model 首度同时展现出真正的泛化(Generalization)与多工能力(Multi-tasking)。泛化意味著模型学到可扩展的语义与分析能力,能在新的指令形式与问题情境下维持稳定表现;多工则意味著同一套模型可以服务翻译、摘要、图片生成、问答等截然不同的场景应用,无需为每个任务另行训练专用模型。这个突破,使AI从针对单一任务优化的垂直工具,转变为横向的通用、高成长智能服务。同时也对供应链产生實時冲击:自2022年下半起,數據中心的算力需求全面上修,GPU短缺从研究机构蔓延至企业端,并推动整条AI供应链——从芯片、服務器到应用层——重新定位。2024年的下一步:推理(Reasoning)登场。泛化与多工解决「能做什么」的问题,却没有解决「能想多深」的限制。对话式问答提供足够解方,但遇到需要多步骤逻辑推导的任务如解数学题、复杂程序除错、分析法律条文、科学探索、逻辑论证等,模型的能力局限就被暴露出来。这个落差,在2024年下半开始逐步被补上。OpenAI-o1的发布标志著推理时代的开始。推理模型呈现出更接近「System-2」的思考方式——借用心理学家康纳曼(Daniel Kahneman, 1934~2024)的框架:System-1是快速直觉式的反应,System-2是缓慢刻意的深层推理。在实际运作中,推理模型不会直接输出答案,而是先在内部展开较长的(推理)思维链(Chain-of-Thought, CoT),逐步分解问题、排查矛盾、整合逻辑,再收敛出最终回应。数学推导、程序除错、法律条文解析、医疗决策辅助——这些原本只有专业人士才能应付的复杂任务,开始出现跨越式的能力提升。推理能力的形塑,来自几个相互强化的技术突破。最基础的是思维链CoT训练。模型在训练时被要求把推理过程一并展开,而非直接给最终答案,强迫模型在解题时学会分解问题、逐步推进。这种推理的引导,显著提升复杂逻辑任务的表现。其次是强化学习(Reinforcement Learning)的深度整合。模型透过持续与真实任务互动并接收回馈,逐步找出「真正有用的答案」而非「听起来合理的答案」——这成为推理品质得以持续演进的核心机制。值得注意的是,强化学习的奖励机制,也间接强化模型「用更多token想清楚」的行为倾向——更长的思维链往往对应更好的答案,模型在训练中学会以算力(更多token)换品质。第三条路是推论时扩展(Test-Time Scaling),被视为继预训练(Pre-training)、后训练(Post-training)之后的第三条scaling law:不必重新训练模型,只需在推论(inference)阶段投入更多运算资源,让模型「想更久」,就能换取更好的答案品质。正因如此,随著用户数量增加,据报导,目前实际对用户服务时的推论运算需求,已经高于模型训练阶段的算力消耗。推理能力的代价,直接反映在token用量上。传统问答模式下,一次查询平均消耗数百个token;推理模型因为需要展开较长的内部推理步骤,每次查询的使用量往往是传统模式的10到50倍。这种倍数效应已在市场流量结构中浮现:目前推理模型的token使用量,已占整体LLM流量的6成以上,预计会持续增长。这不只是技术规格的改变,而是整个算力需求预测逻辑必须重新计算的开始。当推理能力成熟,一个更大的结构性转变随之而来:Agent 的崛起。Agent (代理人)不是升级版的聊天机器人,而是具备目标驱动、自主规划与多步骤执行能力的AI系统。没有深层推理,Agent只是预先编排好的流程;有了推理,它才能在复杂流程中深度思考,做出判断、处理例外、在不确定性中高价值任务。程序设计是第一个Agent的突破点。GitHub Copilot、Anthropic Claude与Cursor的AI coding工具,目前市占各约24%至25%,生产力提升幅度估计达1.5至3倍。从成长速度可以感受到市场反应的强度:Anthropic的年化营收(ARR)在2025年年增幅逾 800%,Cursor从1亿美元成长至10亿美元、年增达900%。法律、医疗、财务等垂直领域的跟进速度也正在加快:据报导,Harvey的法律AI ARR已达1.5亿美元。OpenEvidence在临床医疗场景的ARR同样超过 1.5 亿美元。这些垂直应用的共同特征,在于它们都依赖多步骤推理——不只是查询數據库,而是在法条、案例与临床指引之间做出复合判断,处理真实世界中的模糊与矛盾。推理的架构决定token耗量只会持续增加。每个新应用场景导入、每个Agent工作流程启动,都意味著更多的思考步骤与更高的算力消耗——这是推理模型的设计本质,不会因为效率优化而消失,只会因为应用范畴扩大而放大。对半导体、服務器、高帶寬存儲器供应链而言,这是结构性的长期需求信號。当推理能力从數字工作流程走向实体世界,影响规模可能再扩大一个量级。工厂排程、医疗诊断辅助、教育个人化、法律文件审查——这些场域一旦嵌入自主推理能力,改变的不只是工具,而是企业工作流程与人员分工的重组。这种重组很可能使对ICT基础建设的需求,从一次性的升级,转为更长期的投入。这波AI资本投入是否会在建设高峰后趋于平缓?推理模型提供一种不同的结构性逻辑。其特性在于,应用规模的扩张会直接转化为持续性的推理运算需求,而不仅是一次性的部署成本。当前推论已成为AI算力负载的主要来源,而推理型推论的运算占比不断攀升。再加上方兴未艾的Agent架构兴起,以及各种以token消耗为核心的智能服务快速普及,算力需求将不再仅仅随模型训练周期波动,而是与日常使用频率高度绑定。当使用深度与应用广度持续扩张,供应链从芯片、存儲器到电力基础设施所面对的需求动能,可能更接近结构性成长,而非单一景气循环所驱动。延伸报导专家讲堂:AI愈强,Token却愈便宜
AI愈强,Token却愈便宜
2023年初,OpenAIGPT-4的API定价约为每百万token30美元;如今,主流前瞻模型已全面重订价格:GPT-4o mini降至0.15美元、Anthropic Claude 3.5 Haiku低至0.25美元、Google Gemini 2.0 Flash更压至0.10美元—降幅从90%到99%不等,而且仍在持续下修。这不是削价竞争,而是深层的技术与市场力量共同作用的结果,并正在引发整个AI生态系的结构性改变。3个相互强化的力量在同时作用,支撑token价格持续下降。首先是模型效率的快速提升。蒸馏(distillation)将大模型的能力压缩进更小的架构,量化(quantization)降低每次运算的位元需求,混合专家架构(MoE)让推论时只启动最相关的小網絡。同样的任务,所需算力持续缩减,而且这个技术优化态势,还没止息。其次,是系统层级的优化。产业界已清楚Transformer推论的运算瓶颈——矩阵乘法占了绝大多数计算量,KVCache的存儲器存取效率与帶寬配置直接影响延迟,而批次处理策略则决定整体吞吐量。从编译器最佳化、推论排程到硬件与系统层的整体优化,让同一套硬件能服务更多prompt、产出更多token。以Google为例,透过TPU与模型、系统的协同优化,在特定工作负载下推论能效出现数倍到数十倍等级的提升,显示推论成本仍有可观的下降空间。接著是竞争格局的根本改变。DeepSeek-R1、Meta LLaMA3、阿里巴巴Qwen2.5等开源模型持续追近闭源frontier模型的效能(约落后7个月),打破少数大厂的定价垄断。开源模型的全球部署量已占整体AI使用的约3成,也成了市场定价基准的压力源。Token成本的持续下降,正在同步触发3个层面的连锁反应。第一,是AI推论应用的急遽扩张。当每百万token的成本从过去的高价模型,下降到数十分美分至数美元等级,大量原本「因成本不具经济效益」的场景开始跨越可行门槛。个人化邮件撰写、實時翻译、文件摘要、程序码生成、多语客服回复、会议纪录整理、合约审阅辅助、报表初稿产生等任务,不再只是试验性功能,而逐步成为工作流程中的常态模塊。关键不在于成本归零,而在于边际成本已低到足以长时间、完整部署推论服务,让AI从「偶尔使用的工具」转变为持续运行的生产力工具。第二,是Agent对工作流程的全面渗透。低成本token是Agent得以规模化的前提。这一点已在市场成长速度上反映出来:Anthropic的营收规模近年快速进入数十亿美元级距,年增幅达数倍;Cursor等AI coding工具在短时间内从千万美元级别,跃升至上亿美元年化营收,成为成长最快的一批AI SaaS产品。这些成长快速的新创几乎无一例外地以agent或workflow automation为核心定位——无论是Anthropic、Harvey、Glean——产品路线指向的是自主代理与垂直工作流程整合,而非单纯的聊天界面。一个agent往往需要与多个工具连续互动、发出数十次甚至上百次API呼叫才能完成任务。token成本的每一次下降,都在直接扩大agent可运行的任务边界与商业规模,同时也引发更多的token用量。第三是价值的持续上移。最具体的案例是程序码生成。Cursor、ClaudeCode等AI coding agent以Claude与GPT-4o为核心引擎,正在重塑开发者的工作流程,而非只是IDE的外挂。Microsoft 365 Copilot、Anthropic Claude将AI能力直接嵌入Excel的公式建议与數據分析、PowerPoint的简报生成、Teams的實時摘要,使AI不再是独立查询工具,而成为日常工作的缺省助手。根据DIGITIMES Research的市场观察,AI产业价值占比将在2026至2028由硬件逐步转向軟件与服务,而应用层的渗透速度,将成为下一阶段竞争的真正起点。成本的持续下压,让另一端的问题更加凸显:如何继续压低生产token的成本(TCO)?显现在2个产业核心。芯片架构是第一个关键。各大CSP正加速投入自研ASIC,针对Transformer推论的计算模式深度最佳化,在特定工作负载下可实现数倍等级的能效提升,使算力成本的下降速度不再完全受制于通用GPU的产品节奏。电力则是更根本的制约因素。高密度AI數據中心的电费往往占营运成本的相当比例,当规模扩张到一定程度,电力取得能力往往比服務器采购能力更早触及上限。近年新數據中心的选址优先顺序已悄悄改变——稳定电力供给逐渐取代土地成本成为首要考量。多家能源研究机构预测,全球數據中心电力需求在未来数年将出现倍数成长,AI扩张的真正瓶颈,已从芯片转向能源。Token成本持续骤降,是AI进入第二阶段的信号。第一阶段的核心问题是「能不能做到」,竞争集中在最先进模型的能力竞赛;第二阶段的问题已经不同——谁能把TCO压得够低、把平臺做得够开放,让更多应用在上面生长,才是真正的决胜点。接下来几年,与其看各家发布什么新模型,不如看推论成本降到哪里、开发者生态有多活跃,以及有多少垂直应用选择在平臺上发展;这些變量的交会处,才是下一波市场重心真正落脚的位置。对臺湾而言,半导体与服務器供应链能否持续协助全球客户优化整体TCO,将决定我们在这一波Token通缩浪潮中的角色与分量。
AI的曼德拉效应
许多人第一次听说曼德拉(Nelson Mandela,1918~2013)当选总统时,都会错愕地说:「我清楚记得他在狱中去世的新闻画面。」这种大规模的错误记忆,被称为「曼德拉效应」(Mandela Effect)。它说明人类记忆不是录影带,而是每次回想时都在重建的神经活动。当微小误差透过媒体传播并被群体强化,最终可能凝固为坚信不疑的「事实」。生成式AI的出现,让这个现象进入危险的新阶段。过去的错误记忆源于人脑的模糊回想,如今却可能来自精心制作的數字幻象。AI能轻易生成高度拟真的内容,例如「C-3PO全银色剧照」或「皮卡丘黑色尾巴百科条目」。这些虚构细节真实得足以欺骗未经查证的观者,一旦在社群媒体病毒式扩散,说服力远超过去的谣言。更可怕的是,AI生成的不只是单一图片或文字,而是包含照片、影片与文章的完整「证据链」,让虚假记忆看似天衣无缝。同时,AI内容正以惊人速度污染信息生态。当人们试图验证记忆时,查找结果往往充斥大量口径一致的错误答案,形成信息回音室。社群演算法又偏好新奇与争议性内容,AI制造的谣言正符合这些条件,于是错误信息在推送与点击间不断循环,甚至被推升至主流讨论。更令人忧心的是,AI不仅能放大既有错误,还能凭空创造从未存在的记忆。想像有人利用AI虚构一个九〇年代的卡通角色,生成动画片段、广告影像与周边商品照片,再编造讨论贴文。这些充满怀旧元素的内容迅速走红,10年后,当年的孩童已成年,脑中仍保留模糊印象。当有人发问「你还记得这个卡通吗?」便会有大批网友响应,甚至补充剧情细节。一个根本不存在的角色,竟成为集体的童年回忆。此时,AI已不是错误的放大器,而是记忆的原始编造者,绕过既有事实,直接向集体意识注入从未发生过的过去。这绝非单纯趣闻,而是深具社会风险的征萬億。当伪造记忆结合拟真图像、详尽文本和庞大社群互动,真实与虚构的边界将愈加模糊。它可能动摇人们对历史的理解,使司法证据效力大打折扣,甚至撼动政治共识。如果某个重大事件被AI大规模改写,数百万人因而误解,后果难以想像。更极端的情境是,当AI生成的虚假内容数量超过真实信息时,查找引擎甚至可能将错误答案置于前列。此时,真相反而成了需要额外努力证明的「少数说法」,我们将进入一个「真相倒置」的时代。因此,社会必须建立數字免疫系统。技术上需要更精准的检测工具,識別内容是否为AI生成。制度上,平臺应透明标注AI内容,并对恶意散布者设立规范;教育上,更需强化數字素养,培养理解演算法运作的能力,养成交叉验证与批判思考的习惯。在个人层面,每位使用者都应保持警觉。我们必须追溯信息来源,不轻信单一说法,也不要因「众人皆信」就放下怀疑。面对任何看似「众所周知」的信息,都应该问3个问题:来源是什么?是否有可靠第三方验证?是否符合基本逻辑与常识?AI的曼德拉效应提醒我们,过去不再是坚固不动的参考点,而是随著數字技术持续被改写的场域。在这个由演算法与幻象交织的记忆迷宫里,真相的价值从未如此珍贵。当记忆本身都能被制造,守护真实便成为每个人的责任,而我们的选择,将决定未来時代如何理解过去、认识现在。
物联网中药局
传统中医(Traditional Chinese Medicine;TCM)源自古代中国的医学体系,重视个体差异,考虑到个人体质和季节等因素。对于相同的疾病,中医可能会根据不同个体的情况,开出不同的治疗方法和药物。KingNet国家網絡医药比较中医和西医,指出:「中医治本,西医治标。」中草药一直是华人治疗、预防疾病和维持健康的重要手段。比较中医伤科和西医康复医学的治疗方法,可以理解为「中医善于治疗,西医善于诊断」。近年来,随著新冠肺炎病毒的全球蔓延,人们对中医疗愈和增强免疫功能的关注增加。根据中医理论,中草药被用于诊断、治疗、缓解或预防人类疾病。中草药的材料来自自然界,包括矿物质、植物和动物衍生的原材料,以及加工产品和草药汤剂。传统上,中医涉及草药的煎煮,使其中的成分溶解在水中,形成药液。然而,煎煮过程耗时,携带药液也不便。随著中医治疗的普及,传统的草药汤剂正逐渐被科学中药(Scientific Chinese Medicine;SCM)所取代。科学中药并不是直接由原草药研磨而成,而是通过收集草药材料、煎煮和烘焙制成的,大大提高中药消费的效率。近年来,科学中药在消费者中获得认可。病人获得医院或诊所的处方后,会去药房领取科学中药包(装有药粉的纸袋)。药剂师从各种科学中药瓶中测量出处方量的药粉,混合后包装并密封成多日剂量。然而,这一过程通常是手工的,繁琐且易出错。为了解决这个问题,黄信行教授和我提出SCMtalk,一种基于物联网(IoT)的科学中药局机制,能够提高科学中药包生成的效率和准确性。SCMtalk实现4种机械物联网设备:选粉设备(图1 (1)-(7))、混合清洗设备(图1 (8)-(10))、分配设备(图1 (12))和包装设备(图1 (13))。这些设备和SCMtalk服務器安装在一个约53厘米宽、40厘米长、120厘米高的柜子中。通过这些物联网设备,SCM粉末被包装成药包(图1 (11))。选粉设备包括一个内置活塞的圆柱形药罐(图1 (6)),使用前需要填充预混药粉。上述4种物联网设备由IoTtalk物联网平臺管理,该平臺安装在分配和混合柜中的SCMtalk服務器上。分配和包装柜中的现场触控面板(图1 (14))作为多功能控制界面,显示SCMtalk的当前运行状态。SCMtalk也支持远程控制,可以通过任何具有网页浏览器的移动设备进行访问(图1 (15))。浏览器包括一个视讯屏幕,允许药剂师通过镜头線上监控SCMtalk的操作(图1 (16))。分配和混合柜中间的加载口(图1 (12))是分配设备的入口,机器手臂(图1 (8))将药罐(图1 (6))放置在这里。下方是药包的出口(图1 (13)),在自动化过程完成后,可以从下方出口取出药包(图1 (11))。通过应用垂直包装技术,每个处方的药包数量可以达到100个。SCMtalk全自动系统运行,精确分配药粉。其每一个包装速度少于3秒,每个处方可达到超过100包,这在前处理和后续清洁上节省大量时间。这个SCM应用需要信息工程师、药剂师和机械专家的合作,使用物联网平臺来实现智能药房。
辩证法在AI机房
机房深处的嗡鸣中,理性正进行一场无人旁观的演出。AI服務器成列排开,数据流经管线,错误被标记、修正并转化为下一轮尝试。此处既无康德(Immanuel Kant)忧虑的形而上学僭越,也无黑格尔(Georg Wilhelm Friedrich Hegel)期待的绝对精神降临。但若细察训练曲线的起伏,仍可識別出古老的模式:否定之否定,在矛盾中前进,在破裂中重组。康德若见到当代AI系统,或许会感到些许安慰。我们为模型设下界限,正如他为理性划定合法范围。拒绝提示词(Prompt)与伦理对齐机制传递著相同信息:并非所有问题都该被回答,能力并非毫无节制地释放。当AI模型遭遇无法化解的冲突时,它被要求止步并承认限制,而非陷入二律背反(Antinomies)的无尽循环。这是一种知其边界的理性。黑格尔则会指出,这些界限本身即是暂时的。AI模型不断超越旧版本的历程,正是辩证运动的实践。每次微调都否定前一状态,每次架构革新都扬弃(Aufhebung)旧范式。GPT-3让位于GPT-4,并非否定其价值,而是在更高层次将其成果保存并超越。正反合(Thesis-Antithesis-Synthesis)在此演化为技术发展的当代形式,模型在错误中学习、在矛盾中成长。辩证法在此不再是观念运动,而是具体的劳动关系与资本累积。进步叙事掩盖这些代价,使矛盾转移至供应链末端,以不可见的形式延续。在工程实务中,黑格尔的辩证结构被彻底去魅,转化为可操作的技术形式。矛盾简化为损失函数(Loss Function),否定简化为反向传播(Backpropagation),对抗性训练(Adversarial Training)成为核心方法。生成对抗網絡(Generative Adversarial Networks)透过生成器与判别器的制衡,在竞逐中逼近纳许(John Nash Jr.)均衡。此处没有精神的自我实现,只有可计算的最佳化过程。黑格尔相信历史运动指向自由意识的完成,但人工智能显示,辩证结构可以在没有目的论的情况下运作。它无需终点与意义,只要在高维空间中收敛。这印证理性的习性:面对复杂性时,将走向矛盾与扬弃,无论是否有归宿在等待。这种认知令人不安。我们以为进入纯技术时代,摆脱形而上学包袱,但当模型在无数次失败后找到稳定状态,我们只是再次见证理性的老习惯:拒绝简化,必须经由否定寻路。只是这次我们不称之为精神的历险,而称之为机器学习。真正的问题在于,当辩证运动在无意识系统中自动发生,责任由谁承担?没有灵魂的理性依然塑造世界,产生偏见、失业与操控,而后果终由具体的人承受。康德的界限及黑格尔的运动如幽灵般徘徊于机房,提醒我们技术并非中性,理性的形式始终伴随成本。当你站在數據中心外听著冷却风扇的声音,不妨想像运转的不只是矽芯片,还有几百年前关于理性、自由与矛盾的老问题。只是这一次,它们不等待哲学家回答,而直接在现实中展开,由算法执行,其后果则由人类承受。
身有彩凤双翼飞:臺湾半导体产业与电子制造服务产业 (二)
我将半导体与电子业的紧密结合称为芯片经济价值的外溢。以前电子系统经济价值的创造高度集中在芯片单一环节,但是现在电子系统经济价值的创造无法单靠芯片制程的演进,经济价值的创造必须外溢至封测乃至于系统环节,方能完整创造可以交易的经济价值。有两个现象很可以说明问题。一个是进出口數據,臺湾高端芯片的贸易成长与高端电子系统在外贸数量的成长是高度相当相关的;另一个更图像化:黄仁勋来臺湾邀宴总是从最上游的芯片制造一路请到电子系统制造服务厂商。这个近乎典范移转的变化重新塑造供应链。半导体从最起始时的完全整合元件制造(Integrated Device Manufacturer;IDM),透过生产环节的去藕合—线路设计、晶圆制造、封测等环节之间的切割而各自追求单一环节的规模经济,现在因为元件微缩自然条件壁障的接近而趋势反转,又重新整合了。而且这次的重新整合走得更远,从芯片一直整合到电子系统。而且整合的程度相当紧密,这就是文章标题的身有彩凤双翼飞的隐喻。臺湾因为历史和地理的因缘,在AI兴起的年代,挟此双翼,竟然创下7.4%的GDP年增率!这个數據在21世纪的已开发国家中,除了爱尔兰因跨国利益移转(multinational profit shifting)以及IP的重置(IP relocation)外,仅有新加坡曾经到达此一水准。由芯片价值外溢造成半导体与电子制造业的密切垂直整合,在企业管理学的竞争理论中,就是在产业价值链占据多重优势节点,具有高度竞争力。特别是在高端芯片及电子制造服务(EMS)这两个领域中,臺湾世界市场的占比都超过一半,这使得双翼强强联手的地位难以撼动。AI 服務器的应用只是个开端。这双翼开展的强大力量已开始扩充至其他的应用;或者与其他臺湾传统强项连结,形成更强烈的优势。2025年臺湾与英国签订的低地球轨道卫星(LEO)合作备忘录“A Five-year Memorandum of Understanding between the Taiwan Space Agency(TASA) and the U.K.-based Satellite Application Catapult(SAC)to Strengthen Space Industry Collaboration”,英国负责的是系统设计、应用与生态整合,臺湾负责的是硬件制造、零件及供应链的执行,特别是特殊半导体及精密电子模塊。这就是将原先半导体及电子制造的优势应用并扩充至通讯、观测、气象、军事等领域。无人机(UAV)自从在俄乌战场上被实证应用偏向消费性电子的属性后,臺湾在非红供应链中自然成了首选。无人机其上的零件其中有一部分属于精密机械的范畴,譬如用于中短航程的马达。精密机械原先也是臺湾的优势领域,但是面临日、韩的竞争,以及中国的威胁。专注于能与半导体和电子制造的协作之后,就有机会明显区划与竞争者的市场,并且利用协作的其他部分取得优势。电动车、机器人等新兴产业也可以有相同的策略。臺湾的医疗系统常年高居国际评比第一,也是臺湾有高度竞争力的产业之一。但是医疗行为牵涉到法律、保险、文化等多种因素,不易外扩。最重要的,它不是可以量产的产业,也无法出口。所以对于医疗产业的市场行销,过去曾以观光医疗来尝试,结果自然是不显著,观光医疗也有对本土的量能排挤效应。AI出现之后,AI healthcare是当然应用之一。结合臺湾医疗体系中的知识、数据、工作流程(workflow)等,建立诊断(diagnosis)、预后(prognosis)、治疗(treatment)等的模型。这样的AI healthcare产品,不仅可以输出,还可以量产。特别是2020年后欧盟提出主权數據(sovereign data)的概念、2023年 NVIDIA 跟进主权AI(sovereign AI)的概念,使得货柜AI server中心与AI healthcare模型捆绑出口变得可行。这是臺湾医疗产业增值的契机。对于未来的产业,亦做如是想。量子计算是未来高效能计算的一部分,它出现的方式高机率会与传统的计算以混杂(hybrid)的方式联合运算。其实现在量子计算的原型机都帯有一部传统的服務器。问题是未来的量子计算机会因为其型态特殊而另起山头?还是由目前已累积相当动量的AI服務器体系整合进来?NVIDIA 显然更倾向于后者,也在架构上做好准备:CUDA-Q。臺湾的电子制造服务业显然已嗅到商机而开始投入量子计算。自己投入量子计算的基础研发显然已稍晚,利用臺湾已然成形的双翼在量子时代继续分享成长的果实,机会显然比较高。
AI由线条推理到花朵绽放
这场艺术实验始于我手中的弹性尖钢笔(flexible nib fountain pen)。女郎站立时重心微偏,抬起的手指轻触发际,另一手将长发牵引至身前。笔尖在肩线与腹部之间游移,借由墨色干湿的变化捕捉呼吸的节奏。衬衫的翻领、袖口与牛仔裤口袋的折线,在压力转换下形成清楚而克制的结构,这些线条描写衣物,界定身体如何占据空间。创作随后运用大型语言模型(LLM),进入提示词(prompt)的阶段。语言开始取代手势,引导观看的方向。描绘物件的提示要求理解线条的功能,让牵牛花取代织品,成为身体的延伸。人工智能在此展现出真正的推理能力,避免机械地生成装饰图案。先深入解析钢笔原稿的内在逻辑,将每一条线索还原成空间语法。模型识别出哪些线条是承重的结构骨架(structural skeleton),哪些线条标示著遮蔽与显露的边界,哪些则只是暗示形体转折的辅助记号。这个拆解过程是语义层面的理解,不是像素的复制。推理的关键在于转译而非覆盖。人工智能理解到原本属于衬衫领口、袖口褶皱、牛仔裤腰线的那些边界线。这些固定布料本身的功能被巧妙地用来定义形体的转折点与视线的停留位置。于是这些功能性边界被重新诠释为植物生长的潜在路径,藤蔓便沿著既有的阴影逻辑与力学走向自然攀附,顺著肌理的起伏延展。花朵精确落在原先线条最密集、视觉重量最集中的节点上,那些曾经是衣物扣合处、褶皱汇聚处的位置。如今成为牵牛花绽放的所在并非随意安放的装饰。这是从几何边界到有机生命的连续转换,线条的功能在AI的翻译中得以延续,只是语言从布料的物理性转向植物的生长性。当水彩层次(watercolor layers)被引入,淡紫与嫩绿并未覆盖钢笔的节奏。LLM顺著线条留下的路径渗透,在透明与叠加之间建立时间感。身体因此不再是被观看的静态中心,而成为一个正在发生、持续生长的场域。线条在此完成它们的使命,从定义形体到启动生长,最终退场后留下的是一套自洽的生态逻辑。人工智能并不单纯再现人体艺术。LLM由线条推理出花朵,由结构演化为生命。这是由视觉语法翻译成自然法则的静默过程。
身有彩凤双翼飞:臺湾半导体产业与电子制造服务产业 (一)
臺湾的ICT产业,主要包括半导体产业与电子制造服务业(Electronics Manufacturing Services;EMS),于2024年占臺湾出口的65.2%;在2025年,此一数字预估可能进一步提升到74%左右。此一比例是臺湾在世界产业竞争赛事中的特例,对于臺湾未来的进一步产业新发展有深远的意义。电影「造山者」(A Chip Odyssey)中敍述臺湾最早期的半导体CMOS技术引进自美国无线电公司(Radio Corporation of America;RCA),其实对臺湾有一个项不亚于授权半导体技术给臺湾的贡献—先是在1966年臺湾设立的楠梓出口加工园区组装当时不算太先进科技的黑白电视(彩色电视于50年代后期已进入量产),之后陆续有增你智(Zenith)等公司加入此一行列,再加上后来臺湾取得RCA黑白电视技术授权的厂家,鼎盛时期的臺湾黑白电视产量超过世界的一半。这系列电子系统制造的奠基对于臺湾70年代迄今的发展有3个重要的意义。第一个是电子产业的成形。一家企业不算是一个产业,一群关连的企业才是,占全世界产能一半以上更当然是。第二个是将社会菁英人才动员导向电子相关产业。第三个是供应链的建立,当时包括最基础元件的电阻与电容等。这个由黑白电视塑造的产业,形成1970年代开始发韧半导体的国内市场;又由于许多电子产品是面对全球的大比例市场,如前所述的黑白电视、后来的PCB板、个人电脑等,让臺湾的半导体产业在诞生时马上可以用进口替代的策略迎接广袤的全球市场。但是在初期半导体与电子业的关系也就只是松散的元件产品与市场关系,二者并没有太强烈的关连。两个关键转折引发两者之间关系深层的改变,从而结合变得更为紧密。一个是制程演化到28納米之后,平面制程的微缩能增加的经济价值快走到尽头了。此时每个晶體管的平均成本降到历史上最低。之后的制程名字虽然也如摩尔定律般的往22納米、14納米、10納米、7納米等一直走下去,但那只是个节点标记,用来敍述这节点的效能,却与晶體管的真实临界尺度没有太大的关系。所以每个晶體管的平均成本从28納米后又开始拉高。之后晶體管效能的持续提升主要靠的是晶體管3D制造制程,如FinFET、GAAFET、CFET等。3D晶體管制程显然要比二维晶體管制程要复杂许多,兼之临界尺吋无法有效缩小,成本的上升理所当然。另一个原因是AI服務器的兴起。由它对电力饥渴的程度就知道它需要处理數據的速度以及流量。传统芯片的设计原先会同时考虑效能、功率以及面积(Performance, Power, Area;PPA)并且在其中取得均衡,寻求最大的综合经济价值。但是如前所述的,芯片在二维微缩的进展已遭遇强大阻力,而AI的运算又要求极致的算力,所以效能优先;其他的问题嘛,交由封测、乃至于整个电子系统来解决。以前晶圆制造厂商很多选择外包封装测试此一环节,因为后者毛利较低,在晶圆制造厂商的眼中,将资金投入毛利率高的晶圆生产环节才是对资最金最有效的运用。但是由于半导体制程现在面临高效能计算(High Performance Computing;HPC)对于速度严峻的挑战,一味的倾向于提升芯片的效能,其他无法在芯片阶层解决的问题就必须移交给封装测试、甚至是电子系统本身来解决。这个转变解释了很多现象。譬如晶圆代工厂把封装测试重新纳入版图—虽然称之为先进封装,以解决芯片效能不足的问题,包括帶寬、散热、面积效率等。又譬如在AI服務器系统的全光纤化—芯片的速度、散热的优化不足,那就用系统的方式来弥补。
纬创數字算力捐赠
在人类文明演进中,财富形态不断转换,从工业革命支撑生产的钢铁与石油,到信息时代创造价值的数据,再到今日人工智能时代逐渐成为关键资源的算力与算法。随著高端运算能力在部分领域集中于少数组织,社会不平等呈现新的结构样貌。在此背景下,安德鲁.卡内基(Andrew Carnegie)于19世纪留下的精神遗产,为当代提供一条值得参照的思考路径。这段故事始于1850年代的匹兹堡。当时的卡内基仍是一名薪资微薄的苏格兰移民少年,在电报公司从事基层工作。安德森(James Anderson)上校身为退休军官,选择每周六向勤奋的年轻工人开放私人藏书。对卡内基而言,这间拥有约400本书籍的书房不是金钱救助,而是一扇通往知识世界的入口。这段被他人分享资源的经验,深刻影响他日后对财富意义的理解。一九〇一年,卡内基将钢铁事业出售给约翰.皮尔庞特.摩根(John Pierpont Morgan),累积惊人财富。事实上,他早在一八八九年发表《财富的福音》(The Gospel of Wealth)时,便已明确提出富有地死去是可耻的信念。在生命最后20年里,他将绝大部分财富转化为公共资产,资助兴建超过2,500座图书馆,使后来的孩子不必仰赖私人恩惠,也能接近知识。进入现代,科技公司确实提前所未有的工具,但多数人工智能服务仍存在资源与功能上的限制。一般使用者能动用的运算能力,在模型规模与训练深度上,仍远不及顶级研究机构与大型企业。超级运算中心与先进芯片等关键资源,依然高度集中于少数组织之中。因此,如何让算力逐步具备公共性,成为值得严肃讨论的议题。若掌握关键资源的决策者能效法卡内基与安德森上校的精神,将部分高端算力视为公共基础设施,而非仅作为竞争资产,人工智能的发展方向或许会出现不同的可能。这并不意味企业必须放弃既有商业模式,而是在现行体系之外,为学界与创作者保留可被合理使用的公共通道。近年来,已有企业开始以试行計劃的形式探索这类方向。例如纬创推动的算力捐赠方案,尝试将高端运算资源提供给部分新创团队与学研机构,用于大语言模型训练与微调、模型推论与部署,以及虚拟环境模拟等应用,让原本受限于资源的团队得以进行实质研究。这类尝试呼应安德森上校开放书房的精神,只是媒介由书籍转变为运算能力。在这样的构想下,算力中心应如同当年的书房。这种分享并非单向施予。卡内基当年要求社区承担图书馆的维护责任,是为了确保公共资源能被负责地使用。放在人工智能时代,这意味著使用者与社群必须参与治理与监督,使技术回应实际需求,而非仅服务于少数目标。实现算力公共化势必面临成本与管理上的挑战,但透过公私合作与跨领域协调,仍有可能逐步推进。当企业愿意分享部分资源,而学术与公共机构能有效管理,一个更具包容性的创新环境便有机会成形。出身资源匮乏地区的年轻人,将不再因门槛而被排除在创新之外,原本可能加剧不平等的技术集中,也能转化为推动文明进化的力量。最终,真正的财富不在于拥有多少服務器或芯片,而在于为他人打开多少通往智能的入口。若算力能逐步成为如同道路与电力般的公共资源,机会的流动性便得以维持。那份源自19世纪少年在安德森书房里感受到的希望,也能在今日的数据流动中,持续转化为改变命运的可能性。
智能应用 影音