智能应用 影音
知识的传播
知识传播的机制随着时间,持续演进。在实体书数码化后的今日,提到大量快速散布知识的机制,大家都公认是网际网络(Internet)。网际网络大量信息的交替下,产生ChatGPT这种极端智能的生成式人工智能(generative AI),更对人类的知识演进有巨大影响。如果问起大量复制知识的始祖是谁,西方人都会说是古腾堡(Johannes Gutenberg, 1398~1468)。古腾堡最早印行的圣经甚至成为很多图书馆的镇馆之宝。我每次访问耶鲁大学,一定会到拜内克古籍善本图书馆(Beinecke Rare Book and Manuscript Library)朝拜其收藏的纸本古腾堡圣经,百看不厌。全书以拉丁文印行,每页2栏,各42行,因此被称为「四十二行圣经」(42-line Bible)。每当我来到美国加州洛杉矶,也会到杭庭顿图书馆(The Huntington Library)朝拜其收藏的另一本古腾堡圣经,这是羊皮版,字迹清晰,油墨没有褪色或晕开。每次观赏,都是不同的惊喜。杭庭顿图书馆也收藏英国第一本印刷书籍《特洛伊历史故事集》(Recuyell of the Historyes of Troye),这作品原本是法国作家Raoul Lefèvre 创作于1464年的浪漫史诗,内容讲述希腊神话中行侠仗义的英雄故事,具备中世纪骑士文学的色彩。英国之前都是靠手抄本流传,直到William Caxton从欧洲大陆引进第一代印刷机。杭庭顿图书馆的主人Henry Huntington(1850~1927)有许多国内文物的收藏,但我找不到杭庭顿图书馆收藏最早的国内印刷书籍。现存世界上最古老的金属活字本,是1377年高丽佛经《白云和尙抄录佛祖直指心体要节》一书。高丽的印刷术是学国内的。国内活字印刷术的发明早于古腾堡,但最早的国内印刷书籍却已失传。法国着名作家Rene Etiemble(1909~2002)称「所谓古腾堡可能是印刷术的发明人」是欧洲本位主义的欺骗行为。根据沈括(1031~1059)的《梦溪笔谈》,最早的活字印刷起源于1040年(宋朝),毕昇发明胶泥活字印刷术,替代雕版印刷术,包括制字、贮字、排版、拆板和刷印等一整套活字印刷术工序,与后世铅字排版的原理完全相同。其后历代出现各种活字铸造技术,所使用的材料包括木头、陶土、陶瓷、铜等。然而活字印刷在国内并未流行,仍然以雕版印刷为主。毕昇只是一位工匠,历史文献上甚至未曾保存他的完整生平事蹟及肖像。若非当官的沈括帮他记上一笔,后世可能根本不知道毕昇是何许人也。尽管国内比欧洲早400年发明活字印刷术,成就却被漠视。近代的活字印刷术发明仍然归功于古腾堡。在网际网络推动出巨大数据的AI时代,我期待「现代毕昇」的出现,为华人争光。(国立阳明交通大学资工系终身讲座教授暨华邦电子讲座) 
CES 2024展前了望:各类AI百花齐放、落地应用关键一年
2024年1月4日,CES主办单位美国消费者科技协会发布名为「What Not to Miss at CES 2024」的新闻稿,揭露CES 2024 四大科技主轴,列名首位的是人工智能(AI),若检视2023年年初同一时间的会前新闻稿,所列举的科技主轴分别是「Automotive and Mobility」、「Digital Health」、「Sustainability」、「Web3 and Metaverse」、「Human Security for All」,AI根本未列入其内。如此正好反应出由ChatGPT所点燃、突如其来的科技新浪潮,其势头是多麽的「凶猛」,该如何看待2024年的AI发展呢?叠加在过去AI基础上发展的生成式AI回头翻阅我过去的演讲简报档案,2017年就在谈「AI的下一步」,探讨从云端延伸到边缘的趋势,这是当时的热门研讨会主题,同样的议题在2023年又成为显学,预期也是2024年的发展热点,这6~7年的时间发生什麽样的改变?若就终端装置来看,在手机领域,高通(Qualcomm)在2015年发表的Snapdragon 820,芯片内部便配置Hexagon 680 DSP,能执行1,024位元的矢量运算,可作为AI推论引擎之用;在PC领域,英特尔(Intel)于2017年11月发布的Gemini Lake处理器,搭载第一代GNA(Gaussian & Neural Accelerator),作为语音处理与噪音抑制等背景工作负载的低功耗AI加速器。就边缘运算来看,在生成式AI这波热潮前,包括云端、服务器、网通、产业电脑等业者,都已提供边缘运算解决方案,用以收集与处理应用场域端的数据,尤其这几年5G的普及与2B通讯服务市场重要性的提升,更推波助澜边缘运算的发展。在演算法与应用方面,传统的机器学习如回归模型或SVM(Support Vector Machine)已普及多年,近10年主要基于卷积神经网络(Convolutional Neural Network;CNN)的特徵萃取/物件识别技术兴起,从人脸识别、人员管理、瑕疵检测、医学影像判读、到自动驾驶与交通监控等各类应用均已逐步普及。在AI导入的效益上,根据McKinsey 2022年12月发布的AI Survey报告〈The state of AI in 2022—and a half decade in review〉,在其受访企业中,导入AI的比重从2017年的20%,提高到2022年的50%;在效益上,2021年调查结果显示,降低成本最明显的领域来自供应链管理,有52%的受访企业表示受惠,而促进业绩成长的最明显领域来自行销/销售领域及产品/服务开发领域,各有70%的受访者表示有实质效益。2024年的AI发展,并非建立全新的基础建设与生态系,而是在此已具备云端—边缘—终端协同发展及各类落地应用的基础上,再进一步推动以大型语言模型(LLM)为主轴之生成式AI的应用落地。生成式AI发展新态势在AI发展上,有几个从2023年延续至今方兴未艾的趋势。从整体生态系来看,LLM软件与服务堆叠(stack)可分为3层,底层是各大模型及其集散平台(如GitHub与HuggingFace);其上一层是各类LLM开发工具,如prompt工程与管理工具;最上层是包括文章写作助理、程序撰写助理、内容与创意生成、查找助理等终端应用程序。ChatGPT带动基于LLM之生态系的蓬勃发展,接下来的发展应会类似iOS与Andorid生态系的发展般,Open AI/微软(Microsoft)与Google会各有其生态系,而现以Meta LLaMA系列为主力的开源社群也会有其生态系,从2023年11月Open AI开发者大会推出GPT Store及定制化GPT「GPTs」,及2023年12月Meta、IBM与英特尔、超微(AMD)及Linux等公司与机构合组开源AI联盟,已可窥见升温的生态系竞逐态势。从模型来看,可见快速走向多元分化的趋势,这包括针对泛用需求或特定工作任务、针对云端/边缘/终端不同场景的模型、或针对不同垂直领域或语系进一步强化等态势。接下来这些在基础模型上百花齐放的衍生模型,甚至可能如AppStore般发展出Model Store的商业模式。例子之一,是基于Meta 开源的LLaMA 2,已衍生出包括中研院、台智云及多个国内大陆业者与机构进行中文优化的版本。例子二是华为云2023年7月发布针对产业需求的盘古大模型三代,该系列模型包括「5+N+X」3层架构,最底的L0层包括自然语言、视觉、多模态、预测、科学计算等五个基础大模型;中间的L1层包括政务、金融、制造、制药、矿冶、铁路、气象等N个产业大模型;最上的L2层则是X个细化场景模型,例如输送带异物检测、台风路径预测等。另一趋势是生成式AI已逐渐从大语言模型朝向多模态模型发展。过去的多模态大模型作法是以既有的语言模型或是经预训练可提取语意特徵的图像模型为基础,再使用多模态训练数据增加新的网络层训练,建立多模态模型。例如GPT-4除文字外,也可接受图像输入便是采此作法。Google在2023年12月所发布的Gemini,则是从一开始便使用多模态数据进行联合训练所建立的大模型,可无缝理解与推论各种模态的输入内容并进行输出,无论是文字、程序码、声音、图像、或视讯内容。当大模型成为各家网络/云端巨擘及众多新创的主要战场时,可预见接下来会有更多原生多模态模型问世。科技硬件业最关心的则是模型小型化与AI on Device的趋势。Meta 于2023年7月公布的LLaMA 2除了70B版本外,也包括已可搭载到终端装置的13B与7B两版本。法国于2023年5月成立的独角兽新创Mistral AI,在2023年9月发布开源的Mistral 7B,主打仅7.3B的参数模型,宣称在所有基准测试结果优于Llama 2 13B,而Google的Gemini Nano版本则是先「蒸馏」大模型,然后进行4-bit 量化的微型模型,针对低存储器容量与高存储器容量终端装置,区分为1.8B与3.25B两个版本,且预告将首先搭载于Google的Pixel 8 Pro手机上。AI on Device的理想是走向AI Everywhere / AI on Every Device,2024年可说是生成式AI落地到各类终端的首年,全球智能手机销售的高峰在2017年,约达14.2亿支,而PC销售高峰在2011年,约有3.6亿台规模。近年除因疫情红利,在2020~2021年创下高成长销售佳绩外,其余时间都处于市场成熟几无成长的状况,AI PC与AI手机成为寄望所在。在物联网装置上,先前tinyML基金会定义tinyML规格,希望在MCU平台上,使用mW等级以下的超低功耗,在Always-on及电池供电的边缘装置执行边缘运算。如今包括像是智能音箱、汽车智能座舱,或是各类机器人等,也都因生成式AI带来功能与应用的提升,有机会进一步刺激市场需求。既有硬件产品外,也诞生一些基于生成式AI的新兴硬件产品,如由美国新创业者Humane所推出的无屏幕穿戴式AI装置AI Pin、另一家美国新创Rewind AI推出挂脖的Rewind Pendant装置。在台湾,募资平台上也有Plaud Note智能录音卡的项目,运用ChatGPT,将录音内容转成逐字稿并整理重点。总之,2024年将是生成式AI在过去的机器学习/深度学习发展基础上,进一步加成与汇流的一年,也是各种硬件、软件与服务大规模教育市场与测试市场水温的一年,着重在建立早期采用者的族群与市场规模,是生态系演化、业者高速竞合,期待、宣扬、亮点与失落交杂的精彩一年!
半导体材料开发新典范(二)
从AlphaGo问世迄今的近10年间,机器学习中的各式神经网络(neural networks)开始逐渐被应用到各种工商业的场景。与材料开发相关的应用之一就是用以优化材料制作过程,这个应用已经进入产业实作有一段时间了。  用机器学习中各种神经网络执行材料制程参数的优化,本是件很辛苦的事。人工智能素有高维度的诅咒(curse of high dimensionality),亦即要优化的问题中参数数目的增加,其所需的算力必须以指数的形式增加。但是相较于以实验来进行制程参数最佳化,机器学习仍然享有绝对的优势。另外,即使不能达到全域最佳化(global optimization),使用可以大幅节省计算资源的局部最佳化(local optimization)也许就足以满足应用的需求。  最近发表于《自然》期刊的文章〈Scaling deep learning in materials discovery〉,揭示运用机器学习于发现材料方法的量子大跃进。  过去使用计算所建立的非有机晶体数据库如Materials Project、Open Quantum Materials Database、AFLOWLIB、和NOMAD利用前述的第一原理计算和简单的原子替代方法,找到4.8万个稳定的晶体结构,新的方法则将此数目再推进一个数量级!  它使用的方法叫GNoME(Graph Network for Materials Exploration)。首先,它建立系统性的方法来产生新结构:考虑晶格结构对称性,以及随机产生的结构。  然后将图像神经网络(Graphic Neural Network;GNN)用上述的那些数据库中的数据来训练,改善结构的模型,用以过滤上述产生的新结构。这些挑选过的新结构再以第一原理来计算其能量,判别此结构是否稳定。  经过上述的反覆训练、筛选、计算、再筛选的程序,GNoME总共找到42.1万个结构,比之前单纯只用第一原理计算及简单原子替代方法建立的数据总比数4.8万足足高了一位数量级。而且数据量愈大,能量预测愈准确—以指数成长的方式进步。  这个方法还有新结构的预测能力。用以训练GNoME的数据最多只有4种原子所组成的结构,但是在没有任何训练数据的情况下,它也可以预测出5、6个单一原子组成的结构,而且与实验结果对照是符合的。  这些与半导体材料的发展有什麽关系?以目前1纳米晶体管的主要候选CMOS架构为例,目前计划以MoS2的二维材料来做通道(channel)材料,这是在工程均衡的考量下从过去已知的1,000多种二维材料中挑选出来的。但是经过GNoME的查找后,存在稳定结构的二维材料现在有5.2万种,也提高一个数量级。负责前沿晶体管结构的研发工程师要不要重新再检视一下这个新增的数据库、看一看是否有新的材料可以建构性能更好的晶体管?  结合第一原理计算与图像神经网络两种工具,以计算方式寻找新材料是至今为止最先进的、最有效的的材料发现方式。于半导体的应用中,其实材料的形成方式也都使用半导体设备。以前面所述的二维材料为例,原子层沉积(Atomic Layer Deposition;ALD)是常用设备。也就是说,半导体制程就是材料制程,研发与量产一体化是很自然的措施。将半导体相关材料研发纳入半导体厂的核心能力,有助于半导体厂整合更多价值增长环节进入晶圆厂,有利于维持长期持续成长的动力。
教育型机器人的作中学
科幻小说作家Isaac Asimov创造「机器人学」(Robotics)这个词汇。他创作9篇短篇小说,收录于《我,机器人》(I, Robot),描绘「正电子」(positronic)的发展,并探讨这项技术的道德含义。正电子类似人类,是拥有人工智能(AI)形式的机器人。机器人要模拟人类行为,很自然地会与AI结合,接下来又会衍伸出许多人文的议题。我演讲时会问听众: 「人类和机器人结婚有意义吗?」Asimov「机器人学」的框架极为宏大,包括机械工程学、资通讯电机学、心理学、社会学,甚至人类学。因此机器人相关的教育专题会成为STEM教育的很好实践方式。STEM是一项跨领域、科目整合的教学方式,核心着重于科学(Science)、 科技(Technology)、工程(Engineering)及数学(Math),后续也延伸包含艺术(Art)。2023年12月,台湾教育界人士对108课纲的做法有许多争议。我认为,解决方案是融合式的减法教育,其实就是STEM的精神。我更强调「作中学」的重要性,其中的实践方式是让学生进行融合不同学科的实作专题。很多人要我举出实例,当中一例是我发展的EduTalk平台。另一个例子则是在新竹县亚太美国学校举行亚太区的教育型机器人竞赛(VEX robotics signature events)。该赛事由机器人教育与竞赛基金会(The Robotics Education & Competition Foundation) 主办。这是全球最大的初中和高中机器人计划,每年会以一场游戏的形式呈现一个激动人心的工程挑战。在老师和导师的指导下,学生们全年参与构建创新机器人并进行竞争。VEX机器人竞赛可以在多个方面实践STEM教育。首先, VEX这一类的机器人竞赛透过提供亲身参与的机会,激发年轻学生参与设计、建造和程序设计机器人的经验。这种参与方式能从小引起对STEM领域的兴趣,鼓励他们进一步深入研究。参与竞赛的学员将应用科学和工程原理,获得实际的经验。这种实践式的学习方法,有助于弥合理论知识和实际应用之间的差距。这些竞赛也同时强调团队合作,分享看法,并善用多样的技能解决复杂问题。这些合作经验增进跨学科团队共同参与创新项目。参与机器人竞赛的学生可轮流在团队中担任领导角色,有助于培养领导能力、专案管理技巧和责任感。参与机器人竞争需要参与者以有创造性的方式应对挑战并解决问题,从中培养批判性思维、适应性和韧性。参与学生会与来自产业的专业人士、导师和评审互动。这种接触使他们了解当前产业实践、标准和技术进步,为学生应对专业STEM领域的期望做好准备。在这次比赛战况激烈。冠亚军一直平手。在闭幕典礼时,朱家明校长邀请我颁奖。颁奖时,我讲5分钟鼓励学生的话。我放了3部影片,是我的研究团队及夥伴进行整合AI及机器手臂的成果,希望借此扩大学生们的视野。最后我给学生一句话: 「享受进行专案的乐趣,快乐的玩耍吧。」学生不只要「作中学」,更要「学中乐」。(现为国立阳明交通大学资工系终身讲座教授暨华邦电子讲座)     
半导体材料开发新典范(一)
现代的半导体产业中,有3个经济价值成长方式:制程继续微缩、先进封装与新材料开发的应用。制程微缩的研发的参与者数目寥若晨星,先进封装的参与者稍多,而新材料的开发参与者贯穿整从上游至下游的个半导体价值链,成为整个产业的新焦点。  传统的新材料开发方式,以合成(synthesis)为主,这是老牌材料强国日、德所擅长的。合成法以各式成分原子来组织稳定的化学结构,然后测试其化合物的各种性质—譬如导电性,以及在外来刺激下材料的反应—譬如顺磁性(paramagnetism),或抗磁性(diamagnetism)。  合成过程当然非常依赖于知识和经验,用以缩小查找适合特定应用目的的化合物范围。但是能否发现适合应用目的的化合物也存有很高的机率性,因为搜索的范围有限,对候选化合物的性质也仅凭臆测,基本上这就是一个试误的过程。另外,合成的制程比较像手工艺,过程中的众多的制程参数及方法过去很多是靠经验或多批次试验的结果,有点像匠人工艺,是以过去的材料先进国家能够维持其材料开发及制造的优势。  进入21世纪之后,由于计算力的快速提升,传统的化合物—特别是晶体(crystal)化合物—的开发、性质预测、稳定结构的发现以及制作工艺的优化方法,都产生极大变化,连带地将改变材料产业的竞态势。  2个领域的进展引发这个典范的转换:第一原理计算(first principles calculation)和机器学习,不久以后也许还有量子计算,这些都是高度依赖算力的操作。其直接影响将是晶体化合物的各类性质可以精准预测、晶体化合物的制程可以最大程度的优化,以及可能的稳定晶体结构可以彻底查找用以建材料数据库等。这些随之产生的新能力对于需要新材料来满足应用需求的使用者当然是梦寐以求的。  第一原理计算,或称之为ab initio calculation,是指从最基础的物理理论出发,计算晶体化合物的各种性质,这里指涉的基础物理理论一般是指薛汀格方程序(Schrodinger’s equation),但是在电子高速运动时,可能要诉诸更基本的量子电动力学(Quantum Electrodynamics;QED)—相对论版的薛汀格方程序。  虽然从最基础的物理理论出发,但是现实的世界极为复杂,即使是一个单一原子系统,除了最简单的氢原子之外,不存在解析解(analytic solution),遑论一般的化合物会牵涉到2个以上的原子核以及数十至于数百个以上的电子,所以某种形式的简化处理是必要的,而数值计算(numerical calculation)也是不可或缺的。过去这些所遭遇困难的量子力学问题,也是当初驱策Richard Feynman倡议量子电脑的原因之一。  虽然第一原理计算其实早就开始于上世纪70年代,但是一直要到90年代后其准确度才逐渐被学术界-包括物理、化学、材料等领域-所接受。受限于当时的电脑计算能力,还无法直接投入产业真实的应用。  第一原理计算可以用来预测一种特定晶体化合物的各种物理、化学性质,从带隙(bandgap)、导电性、极化(polarization)、磁性(magnetism)、光学性质等,几乎无所不包,其中很多性质是半导体产业关注的核心。连现在半导体在纳米尺度制程中最关心的界面性质、缺陷、掺杂等精细结构的叙述,第一原理计算现在都可以给出相当准确的预测。  大概不到10年前,我跟某一晶圆制造公司建议设立一个第一原理计算团队,理由是可以节省大量工程试验批(engineering pilot lots)的经费和时间。当时他们的回应只是笑笑,半导体厂要做数值计算物理的人做什麽?现在他们已经有一支不小的第一原理计算团队了。 Scaling deep learning for materials discovery .
2024年产业展望:AI应用浮现,半导体成长动能方向明确
半导体产业对台湾的重要性不言可喻,其中,台积电在10纳米(不含)以下先进制程具有极高的全球占有率,因此不论是苹果的手机应用处理器(Application Processor)、人工智能(AI)服务器用的GPU或是云端数据中心所需的定制化芯片(Custom ASIC),最后大多数都依赖台积电生产。回顾2023年,整体半导体市场呈现9%的年减幅度,就半导体元件类别分析,主要是受到存储器产品市场年减幅度达到35%所致,少数持续成长的领域出现在AI相关联的服务器用GPU及云端网络数据处理芯片、电动车相关的功率半导体,例如碳化矽(SiC)元件、矽基IGBT等。全球前20大半导体业者中,估计仅有5家在2023年营收可达正成长,包括NVIDIA、博通(Broadcom)、英飞凌(Infineon)、意法半导体(ST)、恩智浦(NXP),后面3家业者主要因为车用半导体占营收比重高,而车用半导体是五大终端应用里年成长率最高者;NVIDIA主要成长来自于AI服务器用GPU及其数据中心用数据处理器(DPU);博通在网通基础设备用芯片及定制化AI芯片拥有高市占率,需求持稳且议价力高。展望2024年,全球半导体市场预期可成长双位数达12%,以下3点值得关注。首先,终端市场持续消耗库存,2024年下半半导体业者库存水准及出货将陆续回复正常。2023年下游终端业者下单缩水以消耗库存,导致近3季半导体业者产能利用率偏低,截至2023年第3季末的半导体业者库存水位仍然高于历史平均水准。预期半导体厂商的产能利用率(特别是8寸及以下晶圆厂)距离恢复正常,恐怕还需要至少2~3季的时间,这一部分可以就各主要国家制造业采购经理人指数及晶圆厂产能利用率、上下游库存水准续作观察。过去以来,半导体市场一直都有景气循环的特性,主要原因是半导体厂全新投资到量产往往需要2~4年时间,投资决策时的需求判断与日后实际需求状况可能有落差,新兴应用崛起、芯片供应链失衡、经济波动、地缘政治等因素都会造成供需态势的变化,过去20年全球半导体市场成长14年,衰退6年。观察中长期去是,仍是处于稳定成长的上升轨道上。 其二,分析半导体终端需求面,2024年四大主要应用芯片市场都将出现正成长。预估四大应用市场分别是智能手机、服务器、汽车以及PC。上述四大类终端产品的年出货量可望较2023年增加(2024年汽车出货量年增幅度有限,但电动车比例可望继续提升,有利车用半导体市场继续成长),其平均半导体含量也会较2023年高,有助2024年半导体市场成长。WSTS最新预估2024年全球半导体市场可望年增680亿美元,DIGITIMES研究中心预估上述四大应用半导体需求年增可达480亿美元,占2024年净成长金额约7成。其三,就热门半导体而言,无疑地AI、高效能运算有关的半导体最值得关注,NVIDIA的服务器用GPU仍然炙手可热,该公司截至2023年10月29日的最新季度毛利率为74%,营业利益104亿美元,营业利益率达57.5%,若单看服务器用GPU及配套软件服务,估计毛利率可达80~85%。NVIDIA之外,定制化AI运算芯片及协助AI运算相关的网通芯片也是高成长的产品,受益者包括博通、Marvell及负责生产的台积电,更多的云端及网络服务业者为降低运算成本及耗电,纷纷往定制化芯片方向发展。另外,AI PC、AI手机的崛起也将带来新的芯片契机,不过2024年还处于模索、定义需求的阶段,预期终端产品大量出货时间点可能落在2025年。存储器市场在2022及2023年连续2年明显衰退,主要原因是存储器市场单价波动大,再加上2022~2023年智能手机及PC两大应用出货衰退所拖累,预估2024~2025年可望恢复成长,2024年因为主要DRAM存储器业者扩产重心放在高端AI服务器必须的高带宽存储器(HBM),在非HBM的DRAM产能增有限,一方面HBM的单位售价远高于一般DRAM,另一方面,减缓一般DRAM产能增也有助于DRAM市场供需持稳,预估2024年存储器市场可望年增40%以上,其中DRAM市场比起NAND Flash市场成长性高,主因供需态势较有利及HBM因素。
2024年产业展望:从汽车市场变化看国内车业崛起
2023年是国内大陆汽车产业崛起的关键里程年。一方面在国内国内市场国产品牌市占率首次过半,一方面赶超德日,成为全球第一大汽车出口国。2024年我们将见证其进一步扩大战果,全球各地市场的汽车/电动车品牌竞争,也将陆续出现洗牌的情况。国内市场首次市占过半国内轻型汽车市场占全球1/3规模,电动车市场占全球近6成,国内业者只要在国内国内拿下显着市占率,在全球就能取得规模市占率。从整体汽车市场势力变动来看,国内国产品牌2016年的市占率为40.7%,其后于2020年来到最低点的35.7%,其后便逐年提升,2021与2022年市占分别为41.2%与47.3%,2023年前11月合计市占率进一步提高至51.7%,11月单月市占率更已高达55.3%,预计2023全年可破52%市占。外资合资品牌长期以来以生产与销售为主,在研发与决策上多受制于海外母厂,而随国内国产品牌业者在电动车与ADAS、智能座舱功能与规格上推陈出新,且产品区隔上覆盖包括豪华车在内的各个价格区隔,而随品质与功能规格提升,国内消费者逐渐对国产品牌有更高的接受度时,市占率消长之势便一去不复返。在自主品牌崛起的过程中,德国除外的欧系品牌及韩系品牌是先被洗刷出局的业者,2022年便已各拿不到2%市占率,日系与德系业者则在2020年市占率分别拿下24.1与25.5%的近年新高,其后便逐年下滑,至2023年11月仅守住15.6%与18.7%市占率。2023年以日系业者的下滑最为明显。若检视2023年1~11月零售销量,广汽丰田年增率衰退5.3%,一汽丰田仅成长2.3%,低于整体市场成长;本田国内2022年销量已跌12.1%,2023年至11月累计销量再跌13.5%;日产汽车2022年走跌超过22.1%,2023年至11月累计销量再跌28.6%。三菱汽车更于10月初宣布退出国内市场。在2023年1~11月国内汽车零售销量前十大品牌,合计拿下58.9%市场,其中国内国产品牌比亚迪、吉利、长安、奇瑞、长城名列第一、三、四、九、十位,合计市占率达32.7%,合资品牌一汽大众、上汽大众、广汽丰田、上汽丰田、一汽丰田则合计拿下26.2%,差额已超过6个百分点!自主品牌主宰国内电动车市场电动车取代油车趋势,是国内国产品牌崛起的一大主因。全球电动车普及以北欧国家为先,但市场规模甚小,国内则是近年渗透率发展紧追其后,但超大规模的市场。国内整体车市近年以2017年为高峰,零售销量2,371万辆,此时油车(纯油车及混动车合计)仍有2,319万辆销量,其中纯油车2,309万辆,混动车(HEV)10万辆,另电动车仅有52万辆。自该年起迄今,每年纯油车销量均为负成长,至2022年仅剩下1,410万辆,2023全年估计约在1,300万辆,比2017年少了整整1,000万辆。即便混动车2023年估计增为85万辆,仍无法掩饰整体油车市场大幅衰退的情况。国内石油巨头中石化已于8月提出,2023年便是国内燃料汽油的高峰,较其先前预期提早2年!电动车占国内整体汽车市场占比,从2022年1月的17.0%,大幅提升至2023年11月的40%。至2023年11月累计国内国产品牌约拿下85%市场,其余仍稍有点市占率的美系品牌与德系品牌则仅各拿下约9%与5% 的市占率,日系品牌仅剩1%,至于韩系与其他欧系品牌已几无市占率可言。在2023年1~11月零售销量前十大电动车品牌中,只有Tesla与合资厂上汽通用五菱排名第二与第五,其余包括比亚迪、广汽埃安、吉利、长安、理想、长城、蔚来、奇瑞均为国内业者。若看2023年1~11月国内汽车的价格市场结构,高价区隔人民币(以下同)40万元以上、30万~40万分别占3%、11%,中高价区隔20万~30万、15万~20万各占17%,低价区隔10万~15万、5万~10万及5万以下各占比34%、15%及3%。电动车渗透率最高的是5万以下区隔,其次是20万~30万区隔,2023年11月渗透率分别达到85%与52%。近几年国内国产电动车业者的市场拓展,其中一路的发展是从5万以下区隔进而延伸到5万~10万及10万~15万区隔的小型车及紧凑型轿车区隔,2023年11月渗透率分别为41%与32%。另一路的发展则是20万~30万区隔,往下一区隔15万~20万及往更高价的30万~40万及40万以上的大型车/豪华车区隔延伸。2023年11月的渗透率依序为36%、46%与32%。除了纯电动车销售持续成长外,2023年更出现以理想为首的增程序电动车市占率大幅成长的态势,在30万~40万区隔市占率已逼近纯电动车,而在40万以上区隔2023年各月销量均胜过纯电动车。 国内跃升为全球第一大汽车出口国非造车新势力的国内国产车厂很早就开始拓展海外市场,但在2010年前每年出口量都在70万辆以下,2011到2020则成长一个位阶,来到80万~120万辆间;自2017年起则每年维持稳定破百万辆的出口规模。疫后出现国内国产品牌的成长大契机!此时国内既有业者以及造车新势力在国内市场激烈竞争下,已经有了一批在电动车或在ADAS/智能座舱的功能与规格上突出的车款,且因内需市场激烈竞争让其具备高性价比,而车厂为寻求量产经济规模及中长期成长而积极拓展海外市场,此时正好面临全球疫后缺料,新车交期长久的供给缺口,国内业者趁势而起!2021年与2022年国内汽车出口量达219万辆与340万辆,2023年1~11月扩大为476万辆,全年可破520万辆。从2020年的108万辆迄今,短短4年增加400万辆,也让国内在这几年连续追上韩国、墨西哥、日本、德国,于2023年首度跃升为全球第一大汽车出口国。在这些国内出口的汽车中,外商中除Tesla外,其余欧美合资厂相对出口不多,国内国产品牌则占整体出口的85%左右,主要业者包括上汽、奇瑞、吉利、长城、比亚迪等,主要出口地区为欧洲、南美、东南亚与中东。因俄乌战争外资车厂退出之故,俄罗斯异军突起,成为2023年国内汽车第一大出口市场,2023年7月起,国内业者便已拿下过半市占率;其次出口主要市场依序为墨西哥、比利时、澳大利亚、英国、沙特阿拉伯,泰国、菲律宾、阿拉伯联合酋长国与西班牙;其中在海外第二大市场墨西哥,市占率也已经破20%。除透过整体出口全散装料(CKD)外,国内业者也积极在海外设置生产据点,进一步拓展各地市场。过去这些年,包括上汽MG品牌、长安、吉利、长城、奇瑞,已陆续在泰国、印度、巴基斯坦、印尼、俄罗斯、埃及等地设厂,接下来包括比亚迪、长安、广汽埃安、奇瑞都会在泰国建厂,此外比亚迪与长城至巴西设厂,奇瑞至印尼设厂。此外,令美国开始紧张的是,包括比亚迪、MG与奇瑞均已在评估在墨西哥设厂。回顾丰田、现代/起亚、大众等车厂的发迹历史,都是先在国内市场取得领先,其后透过贸易方式拓展出口,再进一步至各地设厂深化经营市场,其后在主要市场拿下显着市占率。石油危机后的美国市场之于丰田、现代/起亚,又如经济起飞后的国内市场之于丰田与大众,继之成为全球领先车厂,如今国内车厂正依循前人的成功模式崛起!2023年是国内业者在内需与出口市场出现结构性转变一年,国内业者如何进一步扩大战果,加速颠覆既有的市场与产业结构,既有汽车产业领先国家是否会扩大祭出相关政策延缓国内业者崛起之势,将会是2024年全球汽车产业发展的主要观察重点。
深度伪造技术
Nikola Tesla(1856~1943)在1890年代预言「21世纪时,机器人将取代古代文明中奴隶劳动所占据的位置。」这项预言在当今的人工智能(AI)技术的发展下似乎正在实现。早期的AI技术已经能够大致准确地分辨狗和猫的图片,随着生成式人工智能(generative AI)的突破性发展,它逐渐深入我们的生活并引领着社会变革。当AI技术进入深度伪造(DeepFake)的层次,将会加速我们进入元宇宙世界,实现Tesla的预言。深度伪造是一种透过电脑生成的影片技术,用于创造看似真实的虚假影像。它使用AI技术将一个人的脸替换为另一个人的脸,同时匹配微小的面部表情,从说话到皱眉都能保持一致。这项技术利用深度学习算法和大量训练数据生成逼真的影片,使观众难以区分真实和伪造的影像。制作一个脸部交换的视频通常需要以下步骤:首先,使用编码器处理2个人数百万张的照片。编码器是一个AI系统,用于寻找并学习2个脸部之间的相似之处,并将这些相似之处简化为共同的特徵,并压缩图像。然后,使用一个名为解码器的第二个AI系统,从压缩的照片中恢复出脸部。你训练一个解码器来恢复第一个人的脸部,另一个解码器来恢复第二个人的脸部,因为这两张脸是不同的。当需要进行脸部交换时,只需将编码的照片输入「另一个」解码器。例如,将某甲的脸部压缩图像输入已经训练过某乙的解码器。然后,解码器使用某甲的表情和面部定位来重建某乙的脸部。为了制作逼真的影片,这个步骤必须处理每一帧画面。现今,训练某甲与某乙脸部的模型,以及在影片中合并脸部的过程,几乎可以实时完成。早期有名的深度伪造例子包括2个假影片:美国前总统Barack Obama称呼川普(Donald Trump)为「完全蠢货」和Mark Zuckerberg吹嘘对数十亿人的被盗数据拥有绝对控制。我们在乌克兰的战争中也见证假影片的应用,以及使用知名人物脸孔的成人内容。然而,深度伪造技术也可能被用于音频和图像,大部分国家禁止未经同意且具有邪恶目的的深度伪造使用。不过,除了潜在危险性,深度伪造技术在一些有趣且轻松的应用中也显示出潜力。例如,将深度伪造应用于教育领域,可以使课堂更有趣。想像一下,在英文课堂上,可以邀请虚构的名人来讲解课程,例如刘德华。虽然使用真实人物的深度伪造可能会被视为非法,但是使用不存在的人物则可以避免法律问题。企业也开发并销售深度伪造服务,以实现自动化新闻播报,甚至减少演员的参与,节省成本。例如,TikTok 上就有一个深度伪造的阿诺史瓦辛格(Arnold Schwarzenegger),使用俄语讲话,省去了他学习俄文的功夫。深度伪造技术的应用范围广泛且多样,但我们必须谨慎使用,以避免滥用和潜在的负面影响。只有在合法、道德且有创意的方式下,才能充分发挥深度伪造技术的潜力。(作者为国立阳明交通大学资工系终身讲座教授暨华邦电子讲座) 
全面散热(二)
量子电脑有机会成为终极的散热问题解决方案。Richard Feynman最原始的概念是以量子的方法解决量子问题,首先讲究的是效能。现在耗电最凶的人工智能(AI)服务器相关应用,在量子电脑上也都有其相应的量子AI演算法,速度相对于现有的传统AI运算都是平方加速(quadratic speedup)、甚至是指数加速(exponential speedup)。量子电脑计算速度快自然耗能小,逸出的废热就更少。这是量子计算于散热问题上的第一重好处。  Feynman第二篇谈论量子计算的文献主题,是量子计算是可逆的(reversible),这是与散热直接相关的议题。  传统的二进位逻辑闸运算,譬如AND gate,输入有2个位元,但是输出只有1个位元,也就是说传统的二进位计算过程可能会丧失信息,而丧失信息意味着熵值增加,这就是废热的来源。  量子计算的操作基本上是以微波来控制、转变量子位元的状态(state),计算起始的量子位元数目与计算完成的量子位元数目是一样的,因此没有信息的丧失。量子计算的可逆性基本上是说如果从计算完成的量子位元反着步骤计算,可以回复出起始的量子位元状态。这种可逆性只存在于熵值不增加的计算过程中。也就是说,先姑且不论量子计算的周边线路和冷却需求所可能产生的废热,量子计算的核心部分理论上是不会生废热的。这是量子计算于散热问题上的第二重好处。  量子计算另一个优点较少被提到:量子计算也是存储器计算。所有的量子计算都在停留在一组量子位元上反复操作,毋需将信息挪动到缓存存储器(buffer memory)上—其实目前也没有量子存储器可用。量子位元本身既是处理器,也是存储器本身,这就是存储器计算,自然不会产生搬运信息产生的焦耳热,绝大部分的量子位元属于此一类型。  唯一的例外是光子量子位元。光子在运算时的确会在矽光子的模块上处理,信息的确会在光源和传感器中被传输。但是如上文矽光子一段所述,光子的传输理论上也不会生焦耳热的。因此目前困扰半导体业的焦耳热问题,在量子计算的过程中只存在于其周边线路,并不构成主要问题。 这是量子计算于散热问题上的第三重好处。  半导体发展迄今,摩尔定律的推进以及先进封装的应用,持续增益芯片系统的效能。但由于单位时间内所处理的数据量益发庞大,而芯片的集积度亦同时大幅提高,散热效率提升的需求更加迫切,从芯片、模块、系统各层次的散热方式必须同时于设计时就开始考虑。可以考虑的空间包括线路设计、材料使用、封装方式、外加的散热机制(水冷式封装就是这样进场的!)等,乃至变更基础的计算架构与原理。  废热处理已成计算设备各层级工程的共同瓶颈,我们需要散热总动员!
全面散热(一)
量子电脑、存储器计算(in-memory computing)、矽光子、铜混合键合(copper hybrid bonding)、氮化铝基板/晶圆、氮化矽基板/晶圆等,这些新技术有什麽共通点?  在进入详细讨论之前,我们先退一步看半导体过去的发展考虑。成本、效能、功耗等3个面向一直是半导体过去技术发展的主轴。成本以前靠制程微缩和良率提升,效能提升也靠微缩。功耗问题面向较为多样化,节省能耗基本上靠降电压、使用低电阻材料和设计优化等,处理废热的手段就更复杂了。  上述3个面向的进展需要有权衡的考虑—工程一向是综合效能的权衡问题。资深的电脑使用者应该记得过去有一段时间的个人电脑中装有风扇,也就是说当时要求CPU效能的大幅迈进,迫使散热手段必须升级,外延到在系统层级另外加风扇气冷的手段。之后CPU的线路设计业界有个默契,控制CPU发热在单靠IC自然气冷散热就足以应付的程度,恼人的风扇声就暂时从办公桌上消失。  芯片中的能耗机制主要有2种:一种是晶体管开关的能耗。目前一个状态切换(switch)的能耗大概是在飞焦耳(femto joule)的数量级;另外一种是焦耳热(joule heat),就是电子流经金属连线因为电阻所产生的废热。由于金属连线的宽度在制程长年的微缩下变得愈来愈细,电阻不容易再下降,芯片的效能又愈来愈高、传送的信息愈来愈多。焦耳热在目前的von Neumann计算架构下是热耗散的主要源头。  废热如果无法及时排出,可能会使芯片、系统失效甚或损毁。解决的源头自然是从降低能量使用开始,然后才是排放废热的处理。  散热的手段有3种:辐射、传导和对流。辐射的功率正比于温度的四次方,对于芯片这样的低温,辐射的散热效率是远远不够的,所以半导体或电子系统的散热方法通常是传导和对流的结合。  氮化铝和氮化矽都是半导体业界所熟悉的材料,现在也用做散热材料。氮化铝的导热系数高;氮化矽的导热系数虽然稍低,但是其他机械特性如强度和断裂韧性都很高,综合性能最佳。这二者目前都已制成陶瓷基板/晶圆,用于功率模块的隔热板、或做为外延(epitaxy)功率元件的晶圆基底。这是以高导热率材料来散热的办法。如果需要的话,在基板/晶圆底下还可以用活性金属钎焊法(Active Metal Brazing;AMB)加上一层铜,提高散热效率。  更积极些的办法是减少电源及信号传导所发出的焦耳热。 矽光子是以光信号来替代电信号。理论上光信号的传导是不耗能的,自然也不会有废热,可以极大程度的避免焦耳热的产生。这是为什麽矽光子预计在2025年会进入量产的主要动力之一—人工智能诱发的大量计算,使得现有的电信号传送方式快要让功耗和散热难以负荷。 3D封装中的铜混合键合让数个异构(heterogeneous)芯片间原有的金属连线,变成堆叠芯片上重分布层(Redistribution Layer;RDL)的直接对口铜金属键合,大幅缩短芯片之间原先金属连线的长度,所以焦耳热是降低了。但是3D封装也大幅提升芯片的集积度,使得原本已然艰难的散热问题更加恶化。譬如原先用2.5D封装的高带宽存储器(High Bandwidth Memory;HBM)与CPU/GPU,在改为3D封装之后,居于最底层的逻辑芯片由于上层的存储器芯片层数增加,势必要处理更多的数据运算,因此散热的负担更加沉重,这就是进行式的挑战。  存储器计算的想法更为激进。如果电脑依照von Neumann架构运作,数据必须在CPU与存储器间反覆传递,这是焦耳热产生的最主要原因,那就乾脆把二者合并为一,就没有两个芯片间相互传送的问题。这不算是原始创意,因为人脑就是这麽运作的。只是这方向的研究还在摸索中。