臺湾电子制造服务业养成记:PC、手机、AI服務器以及与半导体的深度结合
PC的问世提供臺湾制造服务进一步演化的机遇。 1974年微仪遥测系统公司(Micro Instrumentation and Telemetry System;MITS)发表Altair8800,之后还有初期的苹果(Apple)电脑。但是IBM PC于1981年问世后才让PC大量进入市场。 臺湾在1984年才开始承接PC的制造服务,此时臺湾却已非昔日吴下阿蒙。首先,第一家提供PC制造服务的宏碁已有自有产品「小教授」,虽然是比较适合于特定用途如训练与教育等领域专用机种,但是已有自己设计的能力,可以同时承接原始设备制造(Original Equipment Manufacture;OEM)以及更进阶的原始设计制造(Original Design Manufacture;ODM)等2种服务。到了1988年,臺湾已经成为仅次于美国的PC出口国;到了2000年初,全世界有80%的PC出于臺湾。 这段经历对臺湾有2个重要意义。一个是对于臺湾刚起步的半导体产业提供了初试啼声的近端市场。芯片供应商包括威盛、矽统、扬智、钰创、华邦、联电、臺积电等,这些芯片供应或制造商在80年代末、90年代初陆续的加入电脑零件供应商的行列。以中国的术语来说叫做国产替代,而且零件能自己供应的比例愈来愈高,可以制造的电子系统种类也愈来愈广。 对于半导体产业,这是成长的沃土;对于电子制造服务业,这是加长供应链的战略纵深。 90年代中期臺湾几家电子制造服务公司开始研发移動通讯,97年起开始2G GSM手机的OEM/ODM业务,业务模式一如之前PC的电子制造服务。 从智能手機時代起,电子制造服务产业将部分产能移至中国,持续扩大其制造产能。 2000年代中期,臺湾开始服務器的EMS/ODM业务。到了2018年,所有主要电子制造服务公司已经能制造完整的服務器以及边缘计算(edge computing)设备。 2022年末,臺湾开始迈入人工智能服務器的制造服务领域。到2024年,臺湾生产的人工智能服務器占全世界93%。除了原先PC、智能手機已然的制造服务优势持续奏效外,另外在半导体累积的经验,包括尖端芯片制造以及先进封装加持下的多重优势价值链,这囊括的市占率似乎是理所当然。 这个电子制造服务的生态系似乎还有持续扩大的机会。在先进计算方面,人工智能的下一步目前近乎可及的题目是量子计算。包括IBM和PsiQuantum等使用不同类别量子位元的公司相继宣布通用容错(universal fault tolerant)、可以应用于解决实际问题的量子计算机将于2029年进入商业量产阶段。 臺湾对于量子计算的研发相较于国际领先群本来就启动时间较晚,而且投入的资源相对不足。IBM不久之前才宣布未来5年内在美国要投资1,500亿美元于量子计算的发展;如果包括制造在内,5年内总计3,000亿美元。与此相较,臺湾对于量子计算技术的投入太迟又太少。 但是如果不是想赚取「先进研发利得」(advanced research gain)的话,臺湾仍然可以用电子制造服务来参与新兴领域,分取红利。 目前NVIDIA先进计算架构已经将量子计算整合入既存的人工智能服務器架构,规划CUDA-Q。臺湾的电子制造服业在近年来已经开始启动量子计算的研发,虽然能量不足以挑战世界已先行多年的发展领先群,但是藉目前已开展的人工智能服務器的巨大翻展动量,以后发的研发来了解新科技,加入下一阶段的发展,这个策略还是有机会延续臺湾电子制造业的优势。
臺湾电子制造服务业养成记:从黑白电视组装开始
最近关于臺湾半导体发展史的影片《造山者:世纪的赌注》(A chip odyssey)中提及美国无线电公司(Radio Corporation of America;RCA)授权、移转半导体技术给臺湾,启动臺湾半世纪的半导体旅程。 其实RCA对臺湾的科技发展有另外更早、影响可能更深远的贡献。1966年RCA在臺湾设立黑白电视组装(assembly)的生产线。 黑白电视在30年代已有样品、40年代已经商业化量产。1954年RCA也开始商业化量产彩色电视,并且70年代以后在美国、日本、西欧等发达地区彩色电视变成主流。但是黑白电视在发展中国家市场仍然是主要的消费性电子产品。RCA将黑白电视的组装工作迁移至臺湾是最佳化低毛利事业部门,一个典型的美国公司的标准操作。 黑白电视迁臺组装这件事有几个重要意义。第一个是移转臺湾现代化生产线以及公司的管理,这个效果毋庸赘述。 第二个是技术移转。当时黑白电视已经算不得尖端科技,因为彩色电视的普及在即。如果组装可以成功地在地运行,将零组件的制造也一起迁移是个明智的选择。这些技术包括阴极射线管(Cathode Rate Tube;CRT)、类比线路(analog circuit)设计、焊接(soldering)、表面粘著技术(Surface Mount Technology;SMT)等。这此技术很多是后来电子设备制造的共同基础。 第三个是产生规模经济。RCA于60年代后期于臺湾开始组装黑白电视,臺湾本地的公司如大同、声宝、歌林等也开始代工组装或制造自有品牌的业务,后续还有更多的臺湾公司以及欧美公司投入相同的领域。在高峰时期,臺湾出口的黑白电视占全世界市场的60~70%。之后的彩色电视业务,虽然各国将之视为较先进的消费性电子产品而有较高的自制意愿,但鉴于已趋成熟的臺湾组装能力,臺湾的彩色电视出口仍然占全世界市场的30%左右。 由于有了规模,与其系统相关的生态就有开始衍生的机会,譬如日本公司投资的零组件,臺湾本地生产的被动元件电阻、电容等。有一个很显著的例子:富士康成立于1973年,最先期的产品就是黑白电视的旋钮(knob)以及塑胶零组件,这就是黑白电视组装业务带来的臺湾电子产业生态系发展机遇。富士康不是孤例,近两年很多电子业相关公司都在庆祝50周年庆,遥想当年电子业生态系统是如何像地衣般全面铺展开来的。 RCA黑白电视组装厂设在1966年刚设立的高雄前镇加工出口区(Export Process Zone;EPZ),之后有如增你智(Zenith)与摩托罗拉(Motorola)等公司的加入。加工出口区的设立当初是为解决臺湾贸易逆差问题的手段之一。 1966年臺湾的贸易逆差为约8,400万美元,这个数目看起来似乎不大,但是在当年占臺湾32亿美元GDP的2.6%。现在美国对全世界加征10%的关税,其主要目的也不过是要解决其占GDP 3%的贸易逆差问题。 加工出口区的设立对于电子制造服务业(Electronics manufacturing Service;EMS)的开展有决定性的影响。除了在关务、税收政策等方面形成肥沃的生态土壤,在全球运筹(logistics)方面提供必要支持,使得规模经济得以持续扩张。这是臺湾电子制造服务业发展的起点。
院长说院史(2):臺湾第一座国立信息学院
2007年初,交通大学校长换届,信息学院院长林进灯转任教务长。新任校长吴重雨指示我接任院长,同年2月正式上任。任内我推动3项核心改革:首先,建立原资工与资科教授的共治机制,加速两系融合;其次,创立联席会议制度,将传统三级三审的会议流程简化为二级,大幅提升行政效率;第三,确立「应用型研究」为学院定位,并与电子信息中心携手推动大型产学合作,为学术与产业接轨奠定基础。我始终强调「可执行性」的管理哲学:决策必须具体明确、务实可行。为消弭系所合并后的本位主义,我邀请前资科系主任简荣宏出任副院长,曾煜棋为资工系主任,同时赋予各研究所所长副系主任职权,建立责任分明的治理架构。人事安排考量专业能力,同时兼顾系所平衡与长远发展。在评鉴机制方面,我们选择不参与IEET认证,仅采教育部评鉴为基准。作为当年全臺唯一未参与IEET的工程学院,这项决策避免教研团队陷入形式化文书作业。我坚信:「教授应将精力投入教学与研究,而非应付评鉴文书。」此理念获得同仁广泛认同。学院定位承袭贝尔系统(Bell System)应用型研究精神,强调技术落地与产业价值。当时臺湾应用研究多集中在「发展」端,而美国「研用融合」的模式更具启发性。为此,我邀请工研院资通所所长林宝树担任学院的讲座教授,其于2009年接掌交大电资中心后,我们共同实践「电资中心与信息学院互为延伸」的愿景:重大計劃由电资中心统筹、学院教授参与;一般計劃则由教授独立执行,形成双向研发循环。在产学合作方面,我主导成立中华电信在交大设立研究中心,并于日后担任副校长时,将此经验推广至全校,创建校级研究中心制度。第一个校级中心是与联发科共建的平臺,接下来则有臺积电、广达、研华、华邦等指标企业相继进驻。这些中心设有专属行政窗口,简化统整智财管理与财务稽核流程,使企业能视研究中心为其研发部门的延伸。同时,我们首创「研究生工作年资认定」制度,强化企业留才诱因,实现产学研三赢。进入AI时代,我认为信息学院应与臺南校区的AI学院深化整合:前者巩固资通讯核心技术,后者注入AI研究能量。企业如今已从「工具应用」转向「流程革新」的AI思维。2024年,华邦电子研究中心选择落脚本院,正是看中AI驱动IC设计的跨界潜力。展望未来,信息教育须超越技术传授,著重培养2项AI难以取代的核心能力:批判性思维与原创性。唯有如此,学子方能在智能浪潮中彰显人类智能的真谛,这正是我对学院发展的最终期许。
院长说院史(1):臺湾第一座国立信息学院
交大友声杂志《院长说院史》专访历任信息学院院长。身为2007至2011年间任职的院长,我接受蓝丽霞女士访问,回顾从学院草创至系所整合的关键历程。「故事要从2004年前说起。」我循著时间轴展开叙述。早在1997年担任信息工程学系主任时,我便注意到一项结构性矛盾:交大原有信息工程系(资工)隶属工学院,信息科学系(资科)则隶属理学院。自1994年并入新设的电机学院后,两系在定位与角色上日渐模糊,不仅反映软硬件学科间的不当分野,更直接影响招生策略与发展方向。尽管当时已有合并构想,但「电机学院下设大型信息系」的框架引发疑虑,計劃始终未能实现。为寻求突破,1999年卸任系主任后,我专程拜访华盛顿大学指导教授Ed Lazowska。该校信息系的跨域发展模式印证我的想法:「信息学科不该被动地附属于电机体系,而应主动建构多元的研究范式。」Prof. Lazowska 更提出數據科学的运作,如何将学院算力放置云端。这些前瞻见解在当年的臺湾是闻所未闻,更进一步重塑我的思维。从2000到2004年,我一直宣扬一所独立信息学院的想法。在当时交通大学电机电子主导工程学科的架构下,推动信息学院独立无异于挑战传统体制。所幸在张俊彦校长与蔡文祥教务长的支持下,学院筹备工作正式启动,由蔡教务长领衔规划。受Prof. Lazowska启发,我建议「一系多所」的创新架构:大学部整合为单一学系,研究所则依应用领域分设。这项打破常规的提案遭质疑,因为资工与资科两系都怕被对方并吞,沦为二等公民。最终在蔡教务长的关键协调下完成合并。2005年8月,交大成立全臺首座国立大学信息学院,原信息工程系与信息科学系合并为核心单位「信息工程学系」。回望当年,「一院一系多所」的设计不仅健全学院体质,也开启跨领域合作的新路径。学院成立后,我选择退居幕后,未参与首任院长遴选。
臺湾量子电脑的发展策略
当IBM Condor的量子位元数已经高达1,121个、Atom Computing Phoenix的量子位元数也已达1,180个,臺湾的量子计算研发2024年才刚刚跨出5个量子位元的原型(prototype)量子计算机的第一步。 量子计算的量产也许不会在立即的未来发生,但是也不会太远,至少目前各方瞩目的PsiQuantum预计在2027年年底开始量商用的机型,并且在2029年达到全尺吋容错(fault-tolerant)系统。 量子计算的商业应用有很大的机率如同人工智能般产生巨大经济价值而重新分配财富,而新财富的分配通常只限于创造经济价值的参与者。以目前在量子技术核心量子位元(qubit)及量子闸(quantum gate)还远远落后前沿科技的开发进度,臺湾在未来的量子時代还有机会在科技新時代分到相应贡献的经济价值吗?答案是有可能的,而且已经悄然发生中。 看现在的人工智能服務器(AI server)便可以明白臺湾会以怎样的策略切入这明日之星的新产业。 其实臺湾的产业几乎没做过基础科研,除了臺湾基础科研的整体体量较小外,对于公司资源的配置,也有基于公司经济尺吋的现实考量。 要在新领域独占鳌头,要做长时间、领域广泛的研发投入,后者基本上是保险策略。极致的例子是IBM以前Watson Lab的风格,机构可以供养科学家以及研究经费做与公司业务没有直接关系的基础科研,甚至因为这些工作而获得诺贝尔奖! 臺湾的公司绝大部分是中小型公司。即便像臺积电在臺湾排市值排名第一的公司,在本世纪之前也未能进入全世界前100大之列。因此对技术硏发的策略长期偏向于做短、中期的技术发展(development),题目的选择与短期内订单的可见度有明显的相关。采用这样策略的风险较低,资金的利用效率较高。以产业内较直白的话来说,就是不见兔子不撒鹰。 不从先期的基础科硏下手、取得先行者的有利位置,却冀望取得产业带来的利益分配,靠的是什么?答案是供应链。 一臺量子电脑会大致有下列模塊:量子处理单元(QPU;Quantum Processing Unit)、控制和读取电子设备(control and readout electronics)、同相/正交混频器(IQ mixer;In-phase/Quadrature mixer)和FPGA 板、低温系统(cryogenic system)和真空系统、经典处理(classical processing)及回馈系统、軟件堆叠(software stack)、校准和诊断工具(calibration and diagnostic tools)等。这些模塊各负责一些功能,譬如经典处理及反回馈统统中就包含经典服務器及纠错控制器(error correction controller)。 以IBM最近1,121位元的Condor这款发展过程中的原型机为例,零组件的数目大约在11,000~16,000个之间,供应链的公司数在150~200个之间,但这数目只适用现阶段的原型机。如果是商用的机型,零组件数轻易会上数十万,因为有些零组件会随位元元数线性成长的。 对照于NVIDIA DGX GB200 NVL72的AI服務器,其中也有10个出头的模塊,合计有大约100,000~200,000个零组件。虽然其中主要的GPU不是臺湾设计的,但是芯片制造之后全在臺湾。臺湾AI服務器的出口,2024年占全世界93%,这是臺湾在此领域150~200家供应链力量的展示,而这力量是沿承自90年代的PC/NB供应链。记得90年代PC/NB产业的口号吗?除了CPU,我们什么都有。供应链不是可以一蹴而就的,因此也很难突然被取代。 未来的先进计算,如果含量子计算,很大机率是包含AI服務器的混合服務器(hybrid server),而且现在的量子计算机就已经包含服務器。 所以臺湾合理、合时宜的量子计算发展策略就是依著沿PC、AI服務器的供应链思路,以供应链的方式参与新产业的兴起。 臺湾的几家电子制造服务公司(EMS)都已经开始踏入这个领域。有的从0开始,建立量子位元研发团队;有的投资量子新创,同时建立公司内的量子团队。如果没法在最关键的研发领域领先,至少先暖身一下。毕竟量子不像传统的电子产业,观念上需要跳跃性的前进。 这样做有异于不见兔子不撒鹰的传统原则吗?并没有。产业链龙头企业NVIDIA已经提出CUDA-Q的架构,也有报导在评估投资量子计算新创公司的打算。兔子已经在视线之内了,正是撒鹰时机。
军事通讯—说码人加密
军事通讯技不断精进,操作通讯系统的兵种就愈分愈细,最早只要一个旗兵。进入电子战后,通讯兵的分工还挺细的。例如话务通讯兵负责发送信號,而译电通讯兵负责接收信號。在体制上虽然是不同功能,但作战时,可没有那么讲究排场,话务和电译就由同一位通讯兵包办。这个兵种往往脑力操劳,要背诵一堆编码,防止通讯的内容被窃听。如何想出让敌人无法破解的口令,更是兵家必争。第二次大战时,德国使用Enigma加密机,配备于U-boat潜艇,行迹飘忽不定,在大西洋击沉大量盟军船只,急得英国首相邱吉尔(Winston Churchill )直跳脚。今日以自然语言AI技术模拟通讯者的生物特征及说话特性,成为加密的金钥,产生AI说码人系统的发展是一个令人感兴趣的领域。模拟通讯者的定制化特性,成为加密的金钥,军队早已采用,是所谓的「说码人」(Code Talkers)加密。说码人其实是话务/译电通讯兵,不同之处是他们像中国以前秘密帮派,会中兄弟谈机密时,就说起「帮派切口」,旁人听不懂。甲午战争时清朝曾以温州话加密;第一次世界大战时,美国采用巧克陶族(Choctaw)的印第安语传送机密军事信息,成功地攻击德军。德、日两国学到教训,在第一次大战后送一堆学生到美国学印第安语如Cherokee、Choctaw,和Comanche。美国军方发现此一现象后,担心德、日两国有能力解码,曾经考虑放弃「说码人」制度。此时一位工程师,也是第一次世界大战的退役军人江士顿(Philip Johnston)建议以鲜为人知的纳瓦荷语言来编码。江士顿从小生长在纳瓦荷印第安保留区,和纳瓦荷族人交往,熟悉纳瓦荷语言及习俗。纳瓦荷的语言结构复杂,较以前的印第安语言更适合用于加密。经过江士顿展示后,美国海军陆战队决定采用这个提案,立即征召雇用29名纳瓦荷族原住民,由他们开始编码工作,总共使用411个字汇。海军陆战队在第一层编码上再以字词取代(Word Substitution),做第二层的加密,例如「Gini」这个纳瓦荷字翻成英文是「Chicken Hawk」,而真正的军事用语是「俯冲轰炸机」(Dive Bomber)。第二次大战期间美国总共动用400位纳瓦荷族的说码人,这个口令一直到大战结束,都未曾被破解。很讽刺的是,1861年时,美国白人将最早的旗语通讯用于和纳瓦荷族的作战,而在第二次大战期间却靠纳瓦荷族来协助美军进行作战通讯,编入美国海军陆战队。2002年电影《猎风移動》叙述1944年,美军在太平洋塞班岛战场上,纳瓦荷族说码人的故事。这部电影点出很基本的人性问题。军方必须全力保护「加解密机」,可是当说码人这个「人肉加解密机」有落入敌人手中的疑虑时,必须先行毁灭。奉命执行毁灭任务的同袍如何下得了手?这个矛盾成为电影诠释的重点。当前科技发展已经实现加密的自动化和数据化,不再需要人工的介入。然而,利用自然语言人工智能(AI)技术来模拟通讯者的生物特征和说话特性,作为加密的金钥,这是否能够强化加密的效果呢?AI说码人系统的发展是一个引人注目的领域。通过应用自然语言处理和机器学习技术,AI能够模拟通讯者的生物特征和说话风格,成为加密的关键。然而,要建立一个全面且安全的说码人系统,需要深入了解特定语言、方言以及文化背景。此外,发展强大且安全的通讯系统还需要考虑超越仅透过文字互动可以实现的因素。目前,AI说码人系统的发展仍需更多的研究和努力。
Edge AI产业来了吗?
相较于目前大语言模型应用绝大部分在云端服務器上推论,Edge AI(边缘AI)强调在装置上独立执行AI模型。这种架构差异在于:可大幅降低因網絡传输造成的延迟,确保實時反应,即使在无網絡离线下也能运作;數據不上传云端,确保數據私密与安全性。Edge AI有机会满足许多新应用场域中对低延迟、高私密的关键要求。这半年来,透过技术突破、产业需求,以及发展轨迹,我们看到Edge AI的产业轮廓,正逐渐形成。模型演算法的高度竞争使得Edge端可用的AI模型愈来愈强大。近年来出现许多参数量在13B~70B级的精简模型,透过知识蒸馏、量化压缩、模型剪枝以及多专家混合(MoE)等技术,这些小模型在使用较少参数的同时还能大幅提升性能,缩小与大型模型的差距 。同时也配备了各种终端应用极度关键的推理(reasoning)能力,包括控制、决策、因果、规划等。SoC与存儲器规格配置同样是促成Edge AI崛起的要素。目前主流高端智能手機、NB的NPU(AI运算核心)已经接近100 TOPS,足够让这些终端模型每秒生成数十个token(语意单元),满足应用场域(文字、语音对话)的生成品质要求。同时,透过低位元精度(如8或4位元)来表示模型权重,有助于大幅降低总位元数,使现有存儲器配置即可支持终端AI推论,释放AI从云端走向终端的巨大潜力。另一方面,各大厂商也在其芯片产品蓝图中,明确规划未来的算力提升,进一步强化Edge AI可行性与效能。在初期应用情境中,智能手機成为Edge AI生态重要桥梁。手机不仅是首批受惠于AI能力提升的装置,更自然作为云端与各类在地智能装置之间的桥梁。透过手机,无线耳机、汽车、AR眼镜等装置都能与云端和手机上的AI模型连动,实现多模态的Edge AI应用。例如,耳机可使用手机(AI模型)實時翻译语音,车载系统可依靠手机辅助娱乐信息,眼镜则利用手机处理视觉、语音任务。智能手机作为随身超级终端,串联各种周边装置,历史轨迹也告诉我们,当網絡封包(packet)的成本逐步下降,通讯功能便普及至各类终端设备。10年后(2017 年),移動产业达到高峰,无论是应用生态系或硬件供应链都蓬勃发展。同样地,随著token成本不断下降,AI 能力延伸至新型态终端设备,触发全新应用场景,也是值得期待。延伸报导专家讲堂:鉴往知来:packet(互聯網)vs. token(大语言模型)垂直产业中也听到应用面需求。过去手机SoC供应商的技术团队,首要工作是优化品牌手机中鏡頭应用的智能功能,但从2024年开始,优化手机中LLM执行效率,成了品牌客户的关键需求。工业场域中,也对于推理功能加速决策效益,工业机器人的执行效率多所期待。过去几年,NAS在中小企业中大量采用,年复合成长率超过 15%,显示这类用户对數據管理与在地运算的高度需求。如今,这些用户也期待能在终端设备上,享受到大型语言模型所带来的自动化与知识管理功能。近来市场数据也显示Edge AI正逐渐萌芽。在最新的季报中,苹果(Apple)新款M4芯片强调AI效能,推动2025年第1季Mac营收年增15.5%,更值得注意的是,新芯片也在2024下半年吸引新用户进入苹果体系。高通(Qualcomm)因手机与车用AI需求激增,手机业务创新高,汽车业务更年增55%,公司也宣称「Edge AI是未来业务成长主要推力」。NVIDIA的Orin车用AI平臺单季营收年增103%,并与联发科合作布局一系列全新终端SoC。芯片设计商与设备供应商正从Edge AI中实际获利。也同时看到OpenAI 以约 65 亿美元的全股票交易方式收购了由前苹果首席设计长 Jony Ive 共同创立的 AI 硬件新创公司 io。这股趋势Edge AI已从概念走向实质商业成长。尽管前景看好,Edge AI推广仍面临多重挑战。首先是应用场域的扩展:用户需求差异极大,不同行业与装置对模型大小、功能要求各异,业者须在通用性与定制化间取得平衡,如何取得具泛化能力的精简模型,解决场域问题,至关重要。其次是功耗与效能的权衡:终端装置受限于电池与散热条件,高复杂推理恐导致过热与续航缩短,对芯片设计与电源管理设下更高要求。再者,生态系初期碎片化,硬件架构多、軟件缺乏统一标准,让开发者必须针对各平臺个别调适,增加成本与阻碍创新。这些挑战若未克服,恐将削弱Edge AI的经济性与可扩展性。不过,回顾移動产业的发展历程,也为今日的Edge AI前瞻团队提供宝贵借镜。
鉴往知来:Apps(移動網絡)vs. Agents(大语言模型)
在前一文中,我们类比互聯網(Internet)以及现今大型语言模型(LLM)的发展轨迹,特别是互聯網的核心传输单位—封包(packet),LLM生成单位—语意单元(token),在基础设施、商业模式发展上呈现出明显相似性。透过回顾packet的发展路径,我们试著描绘出token驱动的AI未来发展轨迹,并预判在产品形态、服务模式与产业价值链上的可能样貌。另一可供借镜的历程,是应用程序(App)在移動網絡时代所引爆的创新与变革。如今,在LLM/LVM多模态大模型推动下,一个以「Agent」为核心的应用生态正逐步成形。延续上文,我们尝试从App的崛起历程,看见代理(Agent)以及边缘AI(Edge AI)未来的可能路径。2007年开始,移動App实现實時互动与高速數據交换,移動用户大量增加,源自于網絡封包传输成本逐步下降,智能手機的运算效能与续航力的进展。App Store的出现更将过去分散、复杂的网页互动模式,整合为图形化、易于操作的应用程序界面,大幅降低使用门槛,使數字服务真正「移動化」、「普及化」。App 不再只是单一功能工具,更透过推播、定位、社群整合等特性,深度嵌入使用者生活。这也带动「长尾效应」—不仅少数爆红应用,而是无数利基型App满足多元、个人化的需求。这场从网页到App的转变,不只是界面革新,更兴起全新App驱动的生态系,翻转整个數字服务的生产与分配模式,也同时快速推升移動設備的需求(2017年达到高峰)。App Store 建构出一套双边市场机制,一端连结开发者创新、另一端连结全球使用者,使原本无法规模化的服务得以商品化、在地化与全球化。过去崭露头角的數字服务如Uber、LINE、Instagram皆倚赖App生态兴起,而App的爆发也带动芯片、傳感器、模塊、电池、存儲器等硬件需求,重塑移動設備供应链结构,并促成新兴品牌与 ODM/OEM 的崛起。Statista统计显示,全球App下载量自2010年的60亿次,成长至2023年的1,430亿次,反映出App模式背后强大的规模经济与網絡效应。臺湾厂商在这波移動化浪潮中,从晶圆代工、封装测试到系统整合与 App 开发皆深度参与,建立完整供应链与生态網絡。这段历程不仅重塑移動产业结构,也为即将兴起的AI代理(AI Agent)模式提供宝贵借镜——当使用者界面再次从App进化为Agent,我们是否能抢先洞察使用需求、运算架构、标准制定与硬件整合的关键优势?如果App是移動網絡时代的使用界面,那么由大模型LLM/LVM驱动的Agent,可能是 AI 时代的核心入口。Agent不仅理解自然语言(及各种傳感信號),还得具备任务规划与执行能力,从单纯对话升级为數字助理。透过多模态推理与工具链结,Agent的应用场景正快速扩展至自动化工作流程、专业咨询、教育训练与知识辅助等领域。未来极可能出现类似「Agent Store」的新型生态系,就如当年App Store一样,汇集多样化、可重组的智能模塊,满足多样性需求。这将加速硬件与軟件的分工整合,促进各种垂直应用场域(如工业、医疗、中小企业、消费者市场)中智能代理的落地机会。随著近来高效率推理模型的快速演进,以及LLM开源生态的蓬勃发展,更进一步推进这样的可能性。同时,终端市场的实际需求也正在浮现,如中小企业的知识管理、自动化应用,以及工控领域中實時推理能力的渴望,也回应了市场的需要。终端装置的硬件规格,也逐渐具备支撑Agent所需的AI算力与存儲器条件。随著LLM开源社群快速演进,如13B等级模型已能在一般移動設備上顺利推理,token生成速度亦逐步接近应用需要,Edge AI的落地门槛正快速降低。根据预测,Edge AI芯片市场将自2023年的24亿美元,成长至2033年的252亿美元,年复合成长率高达26.5%。各大系统与芯片业者也已积极布局AI手机、车用SoC与AI PC平臺。未来,Agent将可自然地嵌入手机、筆記本電腦、AR眼镜、TWS耳机、机器人等多元终端装置,成为新一代语言互动与任务导向操作的使用界面。当然,Agent技术的普及仍面临诸多挑战,除了使用者數據的授权与使用,日益增强的自主性也带来安全、隐私、监管与伦理等层面的高度关注,技术本身的复杂度亦不容小觑。然而巧合的是,这些挑战与机会的交织,恰如2007年移動網絡时代初启时的情境—从应用模式、生态系到硬件需求与供应链架构,皆酝酿著重塑的可能。Agent的发展,正释出一种熟悉而微妙的信號,预告另一波产业典范转移的起点。
一个人武林的美丽与哀愁:论臺积电的先进制程与封装
从年初的CES 2025,3月的NVIDIA GTC,到4月臺积电在北美的技术论坛,以及即将登场的COMPUTEX,这几场科技大秀,在在显示AI服務器的发展与半导体先进制程及封装技术,有著不可分割的紧密关系。几年前NVIDIACEO黄仁勋在媒体上说过几次「摩尔定律已死」。当时我不太理解其中的涵义,直到最近读完Stephen Witt所著《黄仁勋传》(The Thinking Machine: Jensen Huang, Nvidia, and the World’s Most Coveted Microchip),才了解到个中道理。书中谈论到由2012年到2022年,GPU运算能力增加10,00倍,其中属于硬件的晶體管速度(clock rate)只增加2.5倍,换言之剩余的400倍来自軟件程序及数学公式。400倍相对于2.5倍,自然会说摩尔定律已死,更何况NVIDIA在黄仁勋眼中一直是家軟件的公司。但是事实真的如此吗?如果以NVIDIA GPU从2012年的Kepler到2022年Hopper GPU,制程技术由28納米演进到4納米,晶體管数目由71亿颗,一口气增加到800亿颗;运算的单元CUDA core也从不到3000个,扩充到将近15,000个核心。虽然晶體管的速度仅增加2.5倍,但是由於单一芯片的运算核心的数目增加了,算力自然就大幅的提升。如果再加上CoWoS及3DIC的先进封装技术,不仅将多个存儲器芯片(HBM)垂直堆叠在一起,而CoWoS技术更将GPU与存儲器芯片,能紧密地在水平方向摆放在一起。这些先进的封装工艺,最重要的就是希望數字信號这这些芯片中传输,能够走最短的路径。这样一来不仅信號传输的延迟可以缩短,功耗亦可以降低,算力自然就提升了。Blackwell GPU已经利用CoWoS技术,将2个GPU芯片无缝接轨地绑在一块,下一代Rubin GPU将会扩充到4个GPU芯片连接一起。臺积电更提出在2027年实现SoW(system on wafer)。也就是在硅片上或其他形式的基板上,水平放置更多的GPU,甚至开始做GPU的堆叠。这些先进制程及封装上的努力,无非是把更多的运算单元,及暂存的记忆數據,在很小的空间内完成执行,以增强其运算效能。依据此原则,同样的在服務器机柜的设计,也是希望在一个机柜内放置更多的GPU。因此GB系列一个机柜内有72颗GPU,到了下一代Rubin会有144颗GPU,而Rubin Ultra更在一个机柜内放置多达576颗GPU。机柜的设计也由原先水平摆放的tray盘,改为直立式的插槽,以增加GPU密度。这一切硬件上的努力,无非是要提升整体的运算效能,但也衍伸出电源的供应及如何散热的问题。GB服務器系列一个机柜所需的功率在120~150KW,Rubin Ultra将会达到600 KW~1MW。若是一个数据中心拥有500个Rubin Ultra机柜,那就约略等于一个核子反应炉所产出的电力。届时Rubin Ultra的散热,恐怕只有浸润式的液冷一途了。臺积电在4月的北美技术论坛,在先进封装领域著墨甚多。除了SoW、矽光子、3DIC之外,更规划在电源最后一级的转换IVR(integrated voltage regulator),嵌入至CoWoS内的中介层(interposer)。所以在先进制程上,臺积电已经是一个人的武林,不久的将来在先进封装领域,臺积电会是另一个一个人的武林。一个人的武林所衍生出来的就是,如影随行的反托拉斯法(antitrust)。为了淡化臺积电在先进制程的主宰地位,董事长魏哲家曾建议将先进封装也纳入半导体的范畴,借由分母的扩大以降低百分比率。然而目前实际上的发展,恐未能如其所愿。英特尔(Intel)之前为了解决CPU市场独占的问题,不仅付给超微(AMD)一笔和解金,并技巧地让超微成为有实力的竞争者。先进封装相较于先进制程,可以有较多的可行解决方案,群策群力,不必然是一个人的武林。美丽与哀愁,端视我们的态度与做法。
中国曝光机发展现况:EUV
中国工信部宣布DUV信息的同时,上海微电子也发布其2023年申请的EUV专利、2024年9月专利申请公开的消息。延伸报导专家讲堂:中国曝光机发展现况:DUV上海微电子的EUV使用的也是现在商业主流的二氧化碳(CO2)雷射,波长为10.6納米。钖的液滴(droplet)先用钕钇铝石榴石雷射(Nd:YAG laser)打成圆盘状后,再被CO2雷射离子化(ionized)变成钖电浆(plasma),然后其外层电子向低能量态跃迁(transition),释出波长约为13.5納米的光子。之所以要用如此复杂的工序来产生EUV光源,是因为在此波长没有自然的物质的能阶差可以产生如此短的波长。选择13.5納米是因为波长再短一些,就变成X光(0.01納米~10納米)。EUV也很可能是矽基半导体技术的最后一种光源。矽的共价键(covalent bond)长度为0.543納米,而要形成一个块材,至少也要有10几20个原子,否则界面的效应就会严重影响电子于其中的行径。13.5納米光的分辨率以及应有的工程努力如加大数值孔径等—最多再加上多重曝光—要处理这样的临界尺吋尽够用了。所以上海微电子的专利的权利请求(patent claim)主要在光源之外的系统。至于原型机或量产机型的交付,没有官方宣布或较正规新闻。2024年12月30日哈尔滨工业大学因「放电等离子体极紫外光刻光源」工作获得中国黑龙江省的科技创新成果转化大赛的一等奖。这奖只是地方奖项,能引起后续新闻报导自然是因为它牵涉到EUV的光源产生。它产生光源的方式与前述的以CO2雷射来离子化圆盘钖滴粒,借以产生13.5納米光源的工作方式—雷射产生电浆(Laser-Produced Plasma;LPP)不同,它是施加高电压借以离子化钖滴粒产生13.5納米光源,此种方法称放电产生电浆(Discharge-Produced Plasma;DPP)。报导中说它产生的线宽较窄(narrow linewidth)—也就是所有光的波长较集中于13.5納米、功耗较低。二者说法都有误导之嫌。LPP与DPP产生的EUV光都不是相干的(coherent)。如果硬要比较的话,LPP产生的光线宽较窄,但二者均可以经滤光器(filter)将线宽控制在可接受范围内。而DPP的原始功耗较低,恰恰好成为当初与LPP竞争成为EUV光源候选人时未能雀屏中选的主要原因。在相同的能源转换效率(energy conversion efficiency)条件下,光源较高的功率输出代表较强的光亮度(light luminosity),可以用较短的时间完成曝光,提高曝光机吞吐量。DPP EUV能量的提升(scale up)较为困难,因此用来当量产机臺的光源挑战也更大。最后是在2025年3月在《中国激光》期刊上中国中科院上海光学精密机械研究所由林楠领导团队所发表的〈1um激光激发固体Sn靶等离子体EUV幅射特性实验研究〉。林楠曾服务于ASML光源团队,对此题目的产业商业化考虑应该十分熟悉。文章中的1微米固态雷射(solid state laser)使用的就是前述用来将钖滴粒打成盘状的Nd:YAG雷射。固态雷射由于其体积较紧致(compact)、电光转换效率(electrical-to-optical conversion rate)较高(~20%),而且目前输出功率已达千瓦级,未来可能可以提升至万瓦级,有望取代CO2雷射,成为驱动EUV的主要雷射。文中指实验的能量转换效率已达3.42%,若用已商业化的1kW固态雷射,已可来做曝光验证、光罩检测(mask inspection)等工作,并且在一定条件下,进一步用于先进节点的临界尺度以及疉加精度的量测。也就是说,这是一个未来EUV机臺的研究起始点。产业此时的现实考虑是从CO2雷射波长10.6微米转换成Nd:YAG雷射波长1微米对于光源次系统是一个全新的转换,所有的工程工作必须重新来过,而且CO2雷射用于LPP EUV商业化已久,目前的成本远低固态雷射的。所以这个工作更倾向于对未来可能发展方向的研究准备,对于目前的先进制程的突破,短期间内是使不上力的。近期的这些报导距离真正的工程实施都有相当的距离,进步也比较片面。一个EUV曝光机包括EUV光源、光学系统、真空系统、光罩版臺及夹具(reticle stage and clamping)、晶圆臺(wafer stage)、热管理(thermal management)、计量和傳感器(metrology and sensors)、控制电子设备(control electronics)以及軟件及韧体(firmware),大大小小的零组件计100,000个以上,其中很多零件是专为EUV机臺量身定制的。建立此一庞大、复杂、精确的供应链队伍的难度,可能更甚于对单一技术课题的突破,我认为这是中国在发展自有曝光机的最大挑战。
智能应用 影音