DIGITIMES - 椽经阁

笛卡尔与人工智能

17世纪的法国思想家勒内·笛卡尔（René Descartes），不仅以「我思故我在」为现代哲学奠基，也以《几何学》（La Géométrie, 1637）开创解析几何，首次将几何图形与代数方程结合，发明今日熟知的笛卡尔座标系。此一突破不仅改變量学问题解法，更为微积分与现代人工智能（AI）提供核心基础。笛卡尔认为，平面上的每一点皆可用x与y座标表示，而曲线则可转化为變量方程序。这使得几何问题能用代数操作处理，例如圆的方程序 x2+y2=r2x^2 + y^2 = r^2x2+y2=r2。这种将抽象空间数学化的思维，与现今AI模型的建构如出一辙。在AI领域，所有输入的影像、语音、文字數據都需转为矢量座标表示。影像为像素的RGB值集合，语音转为频谱，文字则嵌入高维语意空间。这些数据处理方法，正延续解析几何「将现实投射于数学空间」的思维。神经網絡与支持矢量机等模型，会在多维空间中寻找最佳超平面来分类數據。深度学习训练仰赖梯度下降法，透过多维导数找出使误差函数最小化的方向，步步逼近最优解。此过程需用链式法则计算各层参数对结果的影响，亦即微积分中的复合函数求导。而这些演算法运作的数学场域，正建立于笛卡尔所创的座标系之上。进一步来说，像Word2Vec或BERT这类自然语言处理技术，将词汇转化为稠密矢量，使语意相近的字词在矢量空间中相互靠近，这种「语意即距离」的嵌入技术，也可视为解析几何的延伸。电脑视觉中的卷积神经網絡（CNN），透过多层特征提取，从像素空间转换到形状与语义空间，展现出「座标转换以理解现实」的深层结构。从AlphaGo到GPT-4，AI系统不断在函数空间中寻找最佳解。这些空间的数学结构源自笛卡尔当年奠定的几何与代数统一。笛卡尔的哲学关注「心灵」与「机器」的界线，他认为动物如机械般运作，而人有思考的灵魂。今日AI虽能模拟语言与视觉，但是否真正「理解」仍是哲学难题。从数学化思维到理性工具，笛卡尔提供一把通往AI时代的钥匙，却也提醒我们，智能不只是算法，更是对思维本质的深刻省思。

臺湾优势产业的诞生

臺湾目前有3个产业在全球的表现相对耀眼，分别是医疗体系、电子制造服务和半导体。竞争力的来源虽然在不同产业可能各自相异，但是都有一个共通的来源，而且可能是最重要的因素：长期社会菁英的持续投入产业，而这时间尺度是以甲子为单位来计。臺湾的医疗体系在世界的评比长年高居第一，毋庸赘述。臺湾的现代西方医学训练始于日本殖民政府于1899年设立的臺湾总督府医学校（Medical School of the Taiwan Governor-General，即臺大医学院的前身）。1904或1905年间臺籍人士南志信入学，1909年毕业，成为臺湾本土人士接受近代西方医学训练的第一人，从此引领臺湾菁英从医的序列。臺籍人士于日据时代不容学习政、法专业，而臺湾医生的收入及社会地位长期居于高位，是以持续吸引社会菁英投入，至今仍是大学招生第三类组的首选。医疗体系的管理人员也是从此团体中挑选，这解释了为何臺湾医疗系统能长期脱颖而出。值得一提的是医疗原来是服务业，有强烈的地缘关系。而且医疗、保险等各国都有各自的法律规范，不易将之产品化输出。但是从人工智能逐渐加入医疗体系以后，这类服务性产品的地缘壁垒逐渐消失，可以合理预期臺湾的医疗服务将有扩大版图的可能。从20世纪初迄今，这是两个甲子社会菁英的持续投入。电子制造服务业与半导体产业是另一个故事。1966年臺湾政府鉴于长期巨额贸易逆差的考量，建立出口加工区（Export Processing Zone；EPZ），以赚取外汇、降低逆差。「巨额」的贸易逆差是多少金额呢？不到1亿美元，但这是当年臺湾GDP的2.5%！出口加工区的设立以及其他产业的集体努力使得臺湾于1971年转变为贸易顺差，并且长期维持顺差。当时加工出口区中主要产品为黑白电视，首先入驻的外资企业为RCA （Radio Corporation of America），之后还有增你智（Zenith）等。这些外资企业的先后进驻使得臺湾黑白电视出口产量占世界一半以上。虽然此时彩色电视已经问世，黑白电视算不上高端消费性产品，而且在臺湾的加值也只是简单的组装，但是外商大规模的进驻形成臺湾电子业的基底。后来RCA移转黑白电视技术更进一步深化臺湾技术能力。这些贡献至少不亚于「造山者」中描绘的RCA移转半导体技术给臺湾。电子业的先发成为后来半导体产业发展的沃土。现在看来，此举奠定臺湾电子制造服务的基础，也驱动电子制造的供应链，譬如富士康在1973年成立时便是以电视旋钮（knob）供应商的角色切入电子制造服务产业。也许是巧合，但更可能是薪资的市场机制，当1971年臺湾贸易开始转为顺差时，电机系也同时成为大学第二类组的首选，臺湾的菁英人才开始流向电子业，最后乃至于半导体产业，迄今也近一甲子。有趣的是臺湾特殊的大学入学制度促使特定产业的人才供应特别充裕，间接的也让臺湾的产业发展集中于特殊的领域。对于臺湾这样人口基底相对有限、内需市场狭小的国家，专注与集中恰恰好是应有的发展策略。这段历史可以让目前竭力想发展自有半导体的国家借鉴参照，更可以让想以其他方式掠夺产业的国家省思。

先进封装的标准制定

先进封装虽然在高端手机领域应用中开始发轫，但是在半导体产业的总动员则是因2023年的AI芯片先进封装的产能吃紧。由于先进封装的产品供应链拉得很长，参与者众，半导体业界就想起业内常见做法（common practice）—制定标准规格，以降低价值链各环节间协作所需要的沟通成本及时间。考虑制定标准规格的时候需要考虑的因素主要从技术开始，制定标准的挑战主要有下列几点。第一个是先进封装目前还处于发展初期，技术变迁快速。以2.5D先进封装为例，初期的就有CoWoS-S、CoWoS-L、CoWoS-R、CoPoS甚至CoWoP等，这还只是一家公司的规格。快速进展的技术来不及制定标准规格，也不一定值得订定。由于牵涉到的是封测环节，要列入考虑的因素就远比芯片关注的电性指标要多，必须包含热（thermal）、机械（mechanical）、可靠性（reliability）、翘曲（warpage）、应力（stress）等特性，种类繁多，制定不易。再来是材料的种类也比较复杂。单只是基板（substrate）一项，就有硅片、玻璃等，现在碳化矽（SiC）也可望入列，其他环节也是新材料的创新场域。既然有标准规格，自然就会有伴随的量测和检验，但是先进封装通常会牵涉多个芯片，其结构及电性、功能的检测复杂的程度依整合的程度指数上升。这些挑战在芯片设计时就必须考虑在内，也赋予以前线路设计界术语如design for testing、design for manufacturing、design for reliability新的意义。另外，新的检测项目就要有新的测试设备，这一切都还有待发展。所以即使产业中有制定标准规格的念想，至今被产业界广泛接受规格事实上很少，小芯片（chiplet）的UCIe（Universal Chiplet Interconnect express）3.0在2025年８月被持续推出，算是比较成功的案例。以上的观点大部分是从技术的考量来看，但是影响元件规格制定的，经济上的考虑恐怕是更重要的因素。半导体产业界中最成功、最知名的规格标准化元件当属DRAM。自1993年JEDEC制定SDRAM（Synchronous DRAM）标准后，后续演化的各高端版本延用至今，成为电子系统厂商与半导体元件厂商的共享标准。要制定一个产品的规格要有几个先决条件。首先，产品的市值规模要够大，这样殚精竭虑地协商、规划未来的产品统一规格才有价值。再来就是技术的路标明确，此点前面已经阐明。有统一的产品标准，意味著元件厂商不必与电子系统厂商在界面规格上密切协商，元件产品推出的周期得以加速，系统设计也可以独立进行。统一的标准也缩小产品竞争的范畴：规格一致，产品的效能也一致。不同厂家能用于竞争的只有产品的推出时间、产品的可靠性以及生产成本。对于经济上较有直接影响的—正面或负面的—是产品标准化以后具有大宗商品（commodity）的特性。大宗商品，即使生产厂家数目接近寡头垄断，还是个完全竞争市场。这对于买家当然是福音，因为购买的成本会最佳化。对于卖家也有些自然的好处，市场价格低时会促使买家使用较多数量的产品。因为电子系统的效能有如薪资，有向下的僵硬性，因此市场规模即使在市场不景气时还会不断的扩大。大宗商品市场自然也有其天生的缺陷。由于缺乏买方与卖方的粘滞性，当供需失衡时—即使缺口不大，价格的起伏会急速的倾斜，这便是大宗商品市场经常面临的景气周期问题。市场的景气周期如果处于低迷阶段，又恰好遇到市场外的问题—譬如金融危机，那就是倾家荡产的时刻。事实上，目前存儲器市场的寡头垄断局势就是在上次景气大低潮时淘洗剩下的状况。制定先进封装规格标准社群最推崇的经典案例是HBM。HBM是由DRAM数层堆叠而成，上下之间以矽穿孔（TSV）来连通电源、信号，这是典型的3D堆疉先进封装。HBM的规格沿袭DRAM的优良传统，规格已制定至HBM4、HBM4e，虽然现在产品实际只用到HBM3e。看似HBM是先进封装规格标准制定的经典范例，但是厂商已经放话了：要在DRAM芯片堆叠的底层置入逻辑线路的基底晶粒（base die），以针对特定客户的定制化。看，这是寡头垄断产品业者的意向—迈向定制化而非标准化，而这意向自然是业者考虑自身利益最大化的结论。综合目前先进封装技术进展的状况以及经济面的考虑，我认为先进封装规格标准的制定以及产业界的接纳还有一段很长的路要走。

AI是插画助手，还是插画家？

我过去创作插画，必须亲手完成所有细节。有了AI，只需勾勒轮廓，它便能自动补全。起初它常误解原意，画面失去神韵，例如我画的Julie Andrews白描稿在AI生成后严重走样。但经多次训练，它逐渐掌握我的风格，这让我惊觉：AI是否正从助手迈向取代插画家？數字时代的商业插画、游戏设计与小说封面皆采主画家与助手分工：前者掌构图与人物，后者负责上色与背景。AI正改写这一模式。它能生成完整场景与统一风格的角色，甚至依文字指令完成整幅作品。于是问题浮现：当AI成为主要执行者，作品还能称为「插画家的创作」吗？传统分工清晰，例如日本工作室由主画家定构图神韵，助手执行上色修饰。AI的价值，在于接手重复性高的技术任务。Midjourney、Stable Diffusion与DALL·E等工具能精准模拟笔触与光影。插画家输入草图或文字描述，AI即可快速生成背景与配色。有画家称它是「永不疲倦的助手」，能實時测试多种风格方案。然而，当AI能力逼近人类，界线日益模糊。若AI负责大部分视觉产出，插画家是否仍为创作者？法律上，只要人类给予明确指令并审核成果，仍属人类作品；但在伦理与感知上，观众已难分辨「人笔」与「机笔」，艺术家的独特风格也可能被压缩成演算法模板。插画家如我者，选择与AI共生，把繁琐细节交予AI，自己专注于构图与概念。例如先手绘草稿，再指令AI生成多种背景方案取其佳者；或在AI生成的服饰光影上再创作，注入笔触的温度。这种「AI助笔」模式维持艺术主导权，也提升创作效率。相对地，全由AI生成的插画虽快速完美，却缺乏人性的意图与情感。AI能复制「美」的形式，却无法体会创作的动机。正如摄影未取代绘画，AI亦难取代插画家，但它将重新定义插画，使创作者更像「导演」，专注于构想与审核，而非执笔描绘。这股转变正重塑教育与产业。传统插画训练强调技艺，如今学院课程已纳入AI绘图，重点转向提示设计与风格管理。未来插画家或将成为「视觉策划」或「美术监制」，其专业核心不在技术，而在图像叙事与文化感知。我如此祷告，AI或许能取代插画助手，却难取代插画家。真正的创作超越图像输出，重点在于观点与情感。AI能模仿风格，却不懂其精神。当人类视AI为协作伙伴而非敌手，插画艺术将迈入新纪元：从笔尖延伸至演算法，从劳动密集转向创意驱动。最终，AI取代的不是插画家，而是耗损创作热情的重复劳务。人类插画家的价值，仍在于以想像构筑世界，并以情感赋予画面灵魂。我如此期盼。

宏观量子穿隧效应的应用

2025年诺具奖颁给John Clarke, Michel Devoret, 和John Martinis等3人，以彰显他们在宏观量子穿隧效应（macroscopic quantum tunneling effect）实验的贡献。「宏观」这两个字是相对应于传统上对量子现象了解的误解。经典物理（classical physics）指的是牛顿力学（Newtonian Mechanics）可以描述的现象，一般指的是宏观世界发生的种种现象，而量子现象，一般的解释方法是在微观（microscopic）世界中因为物理尺度微小、粒子个别行径的原因，物体（特别是个别粒子）行径带有机率的特性。特别是微观量子穿隧效应，此现象经常用来彰显经典物理与量子物理的差异。穿隧效应是指1个粒子在其行进路径中遭遇一个位势壁垒（potential barrier）的反应行为。在经典物理中，如果粒子的能量不足以克服位势壁垒，则情况有如开车遇到山，只能就此折返。如果我们一定要这个电子越过此位势，只能赋予此粒子足够的能量，克服位势所造成的壁垒。在半导体元件中，这已是常用方法。譬如在FLASH中要将电子储存于浮动闸极（floating gate）中，施加强大的垂直电压便能将电子从通道中跨越过横亘于通道与浮动闸极之间绝缘体所形成的位势壁垒，这就是在FLASH中的Fowler-Nordheim tunneling。这样的穿隧效应符合经典物理的图像，要越过壁垒只能靠增加能量。然而在量子世界中，能量不足的粒子即使遭遇到了位势壁垒，仍然有机率穿越位势到达另一端。以之前的山与车的用语为例，仿佛在山体中开了一个隧道让汽车通行，因以为名。微观量子穿隧效应是量子力学（quantum mechanics）中的经典范例，普遍见于教科书中。但是接下来的问题是自上世纪量子力学发靱后经常被问起的：微观世界的现象止于什么尺度？或者更直接的问题：宏观的世界也可以看见量子现象吗？特别是量子穿隧效应。 Clarke等3位元物理诺贝尔奖得主于1984~1985间一系列的实验工作证实在宏观世界也可以有量子穿隧效应，而且宏观的物理量也存在量子化的情形。他们的实验是利用约瑟夫森结（Josephson junction）来检视电流的量子穿隧效应。约瑟夫森结两侧是超导体，中间隔有Al2O3的铝基绝缘体。超导体在临界温度（critical temperature）以下电子的流动是以库柏对（Cooper pairs）的方式运动。库柏对是一对电子之间以声子（phonon）配对而轻微的彼此束缚，2个电子具有相反的动量和自旋。库柏对的束缚虽然微弱，但是两个组成电子的距离可以高达数百納米，比现在最小晶體管通道的十几纳米大多了。库柏对在移动时没有电阻，这就是超导体名字的由来。一个电子的自旋是1/2，在统计上的特性是费米子（Fermion）；而一个古柏对自旋是0，在统计上的特性是玻色子（Boson）。许多玻色子可以凝聚（condensate）于同一个基态（ground state）而形成一个宏观量子态。约瑟夫结的两边超导体之间隔有绝缘体，如果电流值在临界电流（critical current）之下，在经典力学中一边的电流是无法通过绝缘体流到另一边的。但是Clarke等3位的实验在谨慎的排除外在干扰如热、微波等因素后，证实在临界电流值以下的电流仍可以量子穿隧至绝缘体的另一方，这就是宏观的量子穿隧效应。这个穿隧效应与以前习见的量子穿隧效应很不一样。量子穿隧效应的经典例子是将粒子（He的原子核，带有2个正电荷）困于一个位势陷阱（potential well）之中。此粒子可以用量子穿隧逃逸至陷阱之外，但是此例中的粒子是个别粒子，而此现像是微观量子穿隧。而Clarke等3人的实验证实宏观量子穿隧的真实存在。另外他们也发现此宏观量子态具有量子化能阶（quantized energy level），此点与我们熟悉的微观世界行径相仿—譬如氢原子的能阶也是量子化的。这是观念上的突破，是以得奖。在应用上，宏观量子穿隧效应大幅提升量子效应在真实世界可以被利用的可能性。在前述的实验中，约瑟夫森结上的电流量子穿隧时会诱发瞬间电压的变化，而电流与电压均是宏观的物理量，可以很容易被观察量测，这是宏观量子穿隧效应在应用上可能优于微观量子效应的原因之一。以现在最具议题性的量子计算为例，发展最迅速的的技术之一是超导量子位元（superconducting qubits），它们都使用约瑟夫森结当成量子位元的基础架构。超导量子位元又有几种类型，最常用的是传输量子位元（transmon qubit）。传输量子位元虽然没有使用宏观量子穿隧效应，却也使用宏观量子态的量子化能阶当成量子位元的0与1。另一种超导量子位元是相量子位元（phase qubits），此处的相是指在约瑟夫结两边的宏观量子态之间的相对相位。如果把此相位当成一个虚拟粒子，此相粒子真的是靠宏观量子穿隧效应在绝缘体的左右穿梭。类似的应用还有耳熟能详的超导量子干涉仪（Superconducting Quantum Interference Device；SQUID），它可以用来测量极细微的磁场，敏感至10−15 T（Tesla）。超导量子干涉仪是由2个以上的约瑟芬森结环绕成圈所组成的仪器，利用通过此圈的磁通量（magnetic flux）的变化引发SQUID上电流和电压来量测磁场大小。SQUID之所以能够如此精确的量测磁场的原因，也是因为约瑟芬森结中宏观量子态的能阶也是量子化。人类文明进展迄今，已经开始在触碰物质结构的边界，量子世界已是可以观察、甚至可以操控的现象。宏观量子穿隧现象给我们一个启示，不限于宏观量子穿隧、也不限于约瑟夫森结，只要有宏观量子态，便有宏观的物理變量可以用于观测、操控此系统，而这正是我们走到納米、埃（angstrom）尺度时出现的及时雨。

想像力增AI时代的能力

在AI快速发展的數字时代，我们常谈演算法、效率与算力，但真正决定AI能否成为「增能力」工具的关键，不是技术本身，而是人类是否具备想像力。想像力，让我们敢于提出不同的问题。当孩子仰望夜空，问：「为什么月亮会跟著我走？」多数大人会回答光线与距离的原理。虽然正确，却抹去问题背后的惊奇。若改说「因为月亮想陪你回家」，孩子的笑声才是最有创意的理解。这种回答不是科学事实，而是一种想像练习，提醒我们在理解真实之余，也别失去感受世界的方式。吉卜林（Joseph Rudyard Kipling）在《就是这样的故事》（Just So Stories, 1902）也以此方式回应「为什么」。〈骆驼怎么长驼峰〉、〈小象怎么得到长鼻子〉、〈豹怎么有了斑点〉，这些故事并非科学解释，而是透过荒诞的情节创造新的「真实」。重复与韵律让故事像咒语般朗朗上口，而亲密的语调则让它成为亲子之间的共享语言。它们不是说教，而是透过幽默与幻想，培养孩子的好奇与创造。这正提醒我们：想像并不是错误信息，而是与真实并行的另一种创造能量。这样的思维正是我们在AI时代所需。AI能生成文字、影像、方案，但若缺乏人类的想像力，它不过是冷冰冰的输入输出。只有当我们以孩童般的好奇来提问，并以创意去引导，AI才会展现真正的增效能。重要的是，我们必须分辨：AI有时生成虚构或错误（所谓「幻觉」），这些并非可靠信息，但若经由我们的判断与引导，这些虚构元素也能成为启发新想法的原材料。AI可以提供「是什么」的答案，但「为什么」与「如果不一样呢」仍须人类来追问。就像吉卜林的故事，它们延续人类自古以来用神话解释世界的传统。AI今日同样能生成新故事、新情境，但要转化为启发与价值，仍取决于我们的想像与判断力。因此，在AI數字时代，想像力不是奢侈的附加品，而是核心能力。科学说明规律，AI延展边界，而想像力则确保我们不会在效率中迷失。当我们勇于像孩子般问出「月亮为什么跟著我」时，AI才能真正陪伴我们，开启新的旅程。不是因为它替代真实，而是因为我们用想像力为它注入新的可能。

Energy + Intelligence：AI竞赛新指标

过去几年，全球大型语言模型（LLM）的早期竞赛几乎都围绕在「评测指标」上。硅谷公司们所引领的这场「AI军备竞赛」，倚赖公开评测基准（benchmark）来展现AI实力：从 MMLU 的跨学科知识、BBH的复杂推论、GSM8K的数学应用、HumanEval的程序设计，到HellaSwag的常识推论、以及Winogrande的语境理解，这些测试成了模型在赛场追逐的技术指标。叙事也极为直接：分数代表能力，分数就是王道。于是，技术优化的路径几乎被锁定——设计更大的模型、注入更多的數據、投入更庞大资本、集中高密度运算资源。然而，当各家模型在标准化测试中不断刷新纪录，「这些评测是否真能代表真实场域」的疑虑也随之浮现。为了凸显AI的场域能力，2024年起，Google与 OpenAI 先后尝试让模型挑战国际数学奥林匹亚（IMO）题目，被视为复杂推论的终极考验，但这些挑战，终究无法反映大众日常的使用场景。于是，美国柏克莱大学研究团队打造的Chatbot Arena，透过大规模真人盲测，让使用者的「体感」直接成为裁判，建立一个更贴近市场的「用户价值」新战场。同时，开源社群则以下载次数、社群优化程度作为佐证，强调模型在实际应用中的应用性。于是，在传统基准分数之外，用户体验与主观感受逐渐成为另一个攸关胜负的评价指标。对于后进者而言，要在AI竞赛中打破既有格局，必须找到不同的切入维度，创造出非对称的攻防空间。这在中国科技公司身上表现得尤为明显：一方面受制于地缘政治，高端芯片的取得受限；另一方面则处于内部竞争极度激烈的环境。在双重压力下，他们不仅追逐「效能极致」，更积极在「系统层」寻求突破。透过垂直整合，挑战者试图以降低训练与推论的「成本」作为切入点，将AI的价值主张，从单纯比拼模型「智能高度」，拓展到「商业效益」的务实层面。这意味著，竞争焦点从「谁更聪明」、「谁的体验更好」，进一步扩展为「谁更务实」：除了「能不能做到」、「好不好用」，还得回答「能不能普及」。 AI 竞赛中积极追赶的Google，发挥自身在數據中心的多年经验，提出另一个关键指标，永续（Sustainable）LLM。在最新发表的研究中，Google 团队揭露：当用户发送一个文字提示（prompt）给Gemini模型时，平均需要消耗 0.24 Wh能量、0.03克二氧化碳，以及0.26毫升水。换句话说，1次文字生成的能源成本，大致相当于看电视9秒钟，或饮用5滴水的等效能耗。需要注意的是，这些数据是以Gemini应用的能耗「中位数」文本提示为基准，并仅限于文字问答场景，尚未涵盖影像或影音等更复杂的生成任务。此外，研究范围也只涉及推论（inference）阶段，而不含更高能耗的训练过程。即便如此，这份报告仍让外界难得窥见营运中大型语言模型背后的「AI 能源帐单」。根据其他研究，目前 LLM 的训练与推论能耗比例约为4 : 6，显示推论已成为整体AI能源足迹中不可忽视的主角。更有意思的是，透过这个研究，我们也看到大模型推论时，各能耗的占比。结果显示，AI加速器（TPU/GPU）消耗约58%的能量，接著是主机CPU与存儲器约占24%，而數據中心的基础设施负担（包含冷却、电力转换等overhead）与备份／高可用性设备共占约18% 。这样的分布非常值得注意：超过一半的能源用在模型运算本身，然而近乎一成也不能被忽略地用于「系统维持与可靠性保障」的功用。更让人惊讶的是，Google 报告同时指出，在过去一年，透过硬件（如 TPU、通讯、储存等）与軟件堆叠的优化，AI 推论的能耗1年内降低33倍，碳排放则下降44倍。这显示能效提升的速度，远远超过我们对摩尔定律的想像。显然在系统层级「Energy + Intelligence」共同考虑下，存在非常大的发挥空间。能源不仅是珍贵资源，更界定AI智能的边界，也迫切需要永续洁净能源的支持：因为「净零碳排」（Net Zero）要求。在这方面，Google 已逐步展开布局：在碳会计的Scope 2范畴（购买电力的间接排放）中，近年持续加码全球各地的再生能源采购，包括太阳能与风能，主动透过市场签订长期的洁净能源合约，确保數據中心与业务能获得稳定的低碳电力。同时，Google也尝试将數據中心转换为绿能资产，并借由参与电网的「需量反应」（demand response）服务，于尖峰时段调整用电量，提升电网稳定。可以预见，随著大型语言模型进入「效率优化」的新阶段，系统层级的调校将比单纯模型演算法更为关键。Google 报告中已开始纳入Scope 1、Scope 2与Scope 3的碳排放计算，而Scope 3更直接牵涉到供应链：从芯片、服務器、网通零组件到各类供应商的碳排责任，最后都会加总进国际云端与AI营运商的ESG帐本。如果国际CSP大厂、前瞻AI模型公司加速要求供应链提供ESG指标，我们在地的ICT供应商，是否已经准备好？这意味著ESG不再只是合规清单，而是全球市场透明度与竞争力的核心要求。对臺湾ICT产业而言，大语言的永续指标至少带来3个启示：第一，效能不再是唯一圭臬，效益才是。芯片与服務器不只要快，更要省，否则难以在全球 AI 供应链中站稳脚步。第二，Net Zero正在成为产品竞争指标，能源效率与碳排揭露将成为跨国合作的必要条件。第三，治理力就是竞争力——能否把算力、能耗与永续整合进企业叙事，将决定企业在全球舞臺的份量。AI的新指标已经浮现：从技术到商业，再到责任与环境（能源）成本，AI竞赛的下半场将不只是「谁更聪明」，而是「谁能在智能与能源之间找到平衡」。对产业而言，同时考量「Energy + Intelligence」，是产品策略与产业定位的新常态。

我所专注的电信系统评估，需要调整多个参数，往往得画出数百张效能评估图来找出最佳解答。最常面临的问题之一是所谓的「维度诅咒」（Curse of Dimensionality）。当數據的维度（亦即参数）增加后，要找到所有可能参数组合的困难度会迅速倍增至无法处理的地步。维度诅咒的挑战，正如我们在AI或大数据领域所面临的困境：当信息过于庞杂，人类必须寻找方法「降维」，才能以有限的视角理解无穷的世界。这个问题由发明动态规划（Dynamic Programming）的理查・贝尔曼（Richard Bellman, 1920～1984）所提出。他的「维度诅咒」警告，提醒我们在多维度情境下计算与查找的困境。后续并没有单一数学家「解决」这个问题，而是透过一系列方法来部分缓解，例如降维（Dimension Reduction）、主成分分析（PCA）、随机投影等。在众多相关学者之中，戴尔可尼司（Persi Diaconis；1945年生）的故事特别引人入胜。他出生于音乐世家，曾在世界著名的茱丽亚学院（The Juilliard School）研修小提琴近9年。14岁时，他遇到美国魔术大师维农（Dai Vernon, 1894～1992），觉得魔术比拉小提琴更有趣，于是逃家跟随维农各处巡回表演。16岁时，他独立行走江湖卖艺。24岁时，他深感魔术技巧进入瓶颈，应该寻求一些理论基础，以提升他的表演。因此，他在书店找到一本机率的入门书《Introduction to Probability Theory and Its Applications, Vol. I》，由斐勒（William Feller, 1906~1970）所写。结果发现难以理解，于是决定进大学学习机率。最终，他成为史丹佛大学统计系的Mary V. Sunseri讲座教授。戴尔可尼司并没有「解决」维度诅咒，但他的研究在随机性、马可夫链与高维几何方面提供降维与分析的启发，对相关领域影响深远。当维度降到2或3时，结果就能以统计图表呈现。常用的统计图表包括圆饼图（Pie Chart）、曲线图（Line Graph）和条状图（Bar Graph）。许多人以为圆饼图是由南丁格尔（Florence Nightingale, 1820～1910）所创，事实上，最早的圆饼图是由英国工程师暨政治经济学家普莱菲（William Playfair, 1759~1823）所发明。他曾担任发明蒸气机的瓦特（James Watt）的助理，帮忙绘制工程图，也参与不少发明。他在1801年的著作《统计学摘要》（Statistical Breviary）中首次使用圆饼图，显示土耳其帝国在亚欧非三洲所占的面积。南丁格尔的贡献则在于善用图表来推动改革。她在克里米亚战争中观察到病死的士兵远多于战死者，但仅靠数字报告难以引起重视。于是她创造了一种玫瑰图（Coxcomb diagram），这是一种与圆饼图相似的放射状图表，用以强调护理改革的成效。她的图表设计虽然被部分统计学家批评「不易精确比较」，但在当时确实发挥巨大说服力，让英军投入更多资源改善医疗条件，拯救无数生命。相较于圆饼图，条状图在大部分情境下表达信息更好。条状图同样是由普莱菲所发明，他常说「文不如表，表不如图」: 这句话也是我写论文时所奉行的准则。在爱丁堡有一条楼梯小径纪念普莱菲。他的名字也取得很妙。我常说：「Playfair used graphs and charts to play fair」。

计算半导体(二)：量子计算

人工智能虽好，但也有为人熟知的缺陷。机器学习训练时需要有大量的數據输入，而且在建立模型时，有天然的「维度诅咒」（curse of dimensionality）维度是指一笔數據的特徴（features）数目，在數據空间中，这类數據就需要此特徴数目的维度空间中的点来表达。以制程为例，數據的特徴可能就包含温度、时间、长度、厚度等等参数，这个数目就是數據的维度。空间的维度一旦变高，空间的体积成指数成长，即使有巨量的數據，在如此庞大的空间中數據点显得稀疏（sparse），传统的机器学习变得无法轻易的取得數據的相关性，有效的模型难以建立。但是对于量子计算而言，维次不是问题，至少在通用容错量子电脑（universal fault tolerant quantum computer）出来之后绝对不是问题。量子电脑每增加1个量子位元，它可以处理的空间维次数目就可以翻倍，所以对于具有许多特徴（或者参数）数目、较少的數據群体，用量子电脑来执行机器学习就有显著优势。 2025年在Advanced Science由Zeheng Wang等发表的论文 “Quantum Kernel Learning for Small Dataset Modeling in Semiconductor Fabrication: Application to Ohmic Contact”应用量子计算于氮化镓（GaN）高迁移率晶體管（High Electron Mobility Transistor；HEMT）的量子机器学习研究，显示量子计算在少量數據—仅有159笔數據—的状况下，其预测表现远优于传统机器学习，预测数据也与实验结果相吻合。这个研究的题目就是在硅片上外延（epitaxy）长氮化镓/金氮化镓的夹层，在2种材料的界面处形成一个HEMT的二维电子气体（2 Dimensional Electron Gas；2DEG）通道（channel）。电子通道中的电子是由GaN及AlGaN所注入（injection）的。为了能够让AlGaN端能有充份的电子注入，必须于AlGaN上长有金属堆叠（metal stack），并且与AlGaN的界面形成欧姆接触（Ohmic contact）。这样的层层堆叠之后，通常需要退火（anneal）的过程以稳固其分子结构。本研究的目的就是在建立在各种材料厚度、金属堆叠种类、退火温度及时间等参数的模型，借以寻求欧姆接触的最优解。量子计算处理这个研究的方法与传统机器学习的方式有部分大致雷同—这也比较容易公平的比较二者的优劣。首先将制程的37个参数以主成份分析（Principal Component Analysis；PCA）简化成5个参数，然后用变分自动编码（Variational AutoEncoder；VAE）合成新增數據，可以将样本数扩大。这两个步骤在量子计算与传统的机器学习中都一样实施，目的在简化模型建立的复杂度、增加样本数目。量子计算比较不同的是将简化后的5个参数映射到5个量子位元上，实质上是将一个5维的空间嵌入一个2的5次方—32维空间中。然后在此高维度空间中以量子核（quantum kernel）两两比较各數據的相似性（similarity）。量子计算比传统机器学习的优势为在高维度的空间中數據的非线性（non-linear）特徴比较容易显现，所以其所建立的模型比传统机器学习的要较精确。这个量子计算于半导体制程的应用其实是在传统电脑上模拟量子位元及量子机器学习所得到的结果，但是模拟无碍于证明量子机器学习的优越性。量子计算新算力的加入对于半导体的研发意义重大。仅凭少数的數據，就可以建立参数数目巨大的模型；工程批的数目可以大幅减少，研发时程缩短、经费下降。摩尔定律虽然面临较过去严峻的挑战，但是半导体产业增加新经济价值的步伐因有诸种算力的加入而未曾放缓。

计算半导体(一)：第一原理计算与机器学习

现在的半导体厂高度依赖计算能力。2000年后才引进的计算方式主要包括第一原理计算（first principles calculation）和机器学习， 2025年又即将加入量子计算。我将这些方法称之为计算半导体（computing semiconductors）。第一原理计算是指由最基础的物理学底层出发，包括量子力学、电动力学（electrodynamics）等，用以计算材料的诸种性质。第一原理计算于1970~80年代在凝态物理（condensed matters）和量子化学（quantum chemistry）成为标准称谓。在1980~90年代，一些半导体大厂的实验室如IBM，Bell Labs和NEC开始用它来计算高介电值物质（high k dielectrics）、缺陷（defect）、异质结构（heterostructure）等。 2000年后因为第一原理计算的套件广泛开发与商业化，以及计算机算力的大幅提升，许多半导体公司将其整合入研发的工作流程之中。2010年后，第一原理计算已经变成各大晶圆厂的研发标准工具。第一原理计算的应用例子包括高介电值物质（如HfO2、ZrO3等）、缺陷及可靠性模型、新通道（channel）材料（如Ge、III-V族等）、二维材料（如MoS2、WSe2等）。第一原理计算几乎可以涵盖晶格材料的所有性质，包括能帯寛（bandgap）、电场、磁场、自旋（spin）、电子传导（transport）、热（thermal）、振动（vibration）、光学（optical）等性质。第一原理的计算在搭建晶格结构时依所欲建构材料的原子种类、共价键（covalence bond）长度、晶格对称（lattice symmetry）、相位（phase）等因素来组织材料，宛若堆叠乐高。也有能力故意在晶格中空出一两个位置，形成空隙（vacancy）；或者加入其他类原子，形成掺杂剂（dopant）；甚至形成错位（dislocation），这就是半导体制造过程中有意出现的结构或无意出现的缺陷。不同的分子结构亦可设法连接在一起，这就是2种材料的界面（interface）。现在的半导体元件微缩近乎极限，材料的本体（bulk）部分差不多就恰好只能实现电子该有的传导性质。由于本体部分日益单薄，界面性质的重要性逐渐增加，因此成为半导体材料研究的重要题目。总结一下，第一原理在半导体目前最重要的应用有三：一是材料的能带结构与电性（electronic properties）；二是缺陷、掺杂剂和可靠性的分析；三是下時代元件新材料的开发。使用第一原理计算大幅的降低原先试产批（pilot lots）的使用，也缩短开发时间。虽然学术界在2000年起就有如晶圆缺陷分类、良率分析等大数据的应用，但是现代意义的卷积神经網絡（Convolutional Neural Network；CNN）在2015年后才开始应用于晶圆图模式识别（wafer map pattern recognition）。接下来扫描式电子显微镜影像分析（SEM image analysis）以及缺陷检测（defect inspection）也开始以机器学习来处理。到了2017年以后，主要的半导体设备制造商以及晶圆厂开始应用机器学习于缺陷检测、曝光热点侦测（lithography hotspot detection）、制程监控（process monitoring）等。 2020年后机器学习的技术日趋成熟，于半导体工作流程中被广为采用，包括用于良率学习（yield learning）的晶圆图缺陷聚集（wafer map defect clustering）、光罩合成（mask synthesis）及光学邻近效应修正（Optical Proximity Correction；OPC）、热点检测（hotspot detection）、自动光学检查（Automatic Optical Inspection；AOI）、预测性维修（predictive maintenance）等。大致上透过高维度、巨量信息的分析及图形識別（pattern recognition）监控工厂及提升工作效率。由于机器学习的深度渗透，整合后的结构形成智能制造（smart manufacturing）、虚拟工厂（virtual fab）、虚拟晶圆（virtual wafer）更有效率的制造、研发系统工具。

1
2
3
4
5
>>