智能应用 影音
Microchip
ST Microsite
为摩尔定律续命—半导体先进封装技术
超微(AMD)CEO苏姿丰来台参与COMPUTEX 2024,期间有一次的公开演讲,提到她本人很讶异在台湾有这麽多人知道CoWoS(chip on wafer on substrate)技术,这在美国是不可能的事。事实上CoWoS一词是台积电张忠谋创始人一手钦定的,这名字取得真好,一眼就可以望文生义。就如同TSMC一般,很清楚让人知道葫芦里卖的是什麽药。CoWoS是一种先进的芯片垂直堆叠封装技术,也是延续摩尔定律继续前行的最重要利器。摩尔定律过去五十年中,所着重的在晶圆的平面上做不断地微缩。但是当微缩到了纳米等级,最终还是会遇到物理的极限,因此往垂直方向去堆叠是一个必然趋势—如同在人口密集的地方要盖高楼一般。约莫在二十年前,半导体技术尚未进入28纳米制程,研发人员就开始提出3D IC的概念,当时用了「 more than Moore」这个词,以对照摩尔定律的「more Moore」。然而要堆叠芯片技术上并不困难,但是在实际应用上却很难实现,就如同盖高楼,每一层的主结构必须是一致且贯穿的,才有可能一层一层的堆上去。所以只有存储器的芯片,因为是完全相同的架构,才有可能彼此堆叠,但当时的存储器芯片并没有这个需求。之后研究人员提出了矽穿孔中介层(through Si via interposer),也就是在中介层上方的平面放置多个芯片,因为中介层是使用半导体的制程,可以紧密结合这些芯片,并提供高密度的横向走线(RDL),芯片间信号可以走最短路径,提升芯片效能。这就是俗称的2.5D封装技术,此中介层就是CoWoS中的wafer。所以严格来说CoWoS是一个2.5D的封装技术。顺带一提的是这2.5D名词,最早是由日月光集团唐河明博士所提出。台积电是第一家将矽穿孔中介层量产的公司,这多亏蒋爸(蒋尚义)的主导与支持。但是推出来之后,却是叫好不叫座,乏人问津,也就是科技界常说的「solution looking for problems」。后来第一个使用CoWoS技术的是在2011年的Xilinx,将4个FPGA芯片紧密的并排再一起,并利用RDL彼此信号相连。因为CoWoS所费不赀,所以高单价的FPGA为了追求效能,才率先使用。就连苹果(Apple)手机内的AP芯片,至今还未使用CoWoS。接下来直到AI时代的来临,CoWoS才受到广泛的重视。NVIDIA是在2016年的P100 GPU开始使用CoWoS,主要用于与一旁的HBM存储器能紧密的信号相连。有趣的是,HBM是第一个实现3D的芯片堆叠,目前已经可以将12层、甚至16层DRAM堆叠在一起。NVIDIA近期所推出的Blackwell GPU,将2个GPU芯片,以几乎无缝地紧密相连,而中介层提供高密度的RDL以及连接凸块(bump),再次大幅提高信号传输速度,并减少功耗。此番CoWoS技术所带来的效益,几乎等同于将制程技术推进一个时代。然而,随着需要相连的芯片愈多,CoWoS中介层所需的面积就持续增加,不仅增加费用,而一片12寸大的晶圆能提供的数目也势必减少。玻璃基板当作晶圆中介层的想法就应运而生。首先,玻璃基板够大(5.5代玻璃面板是1.3米 x 1.5米),另外玻璃基板够平整,可以制作出高密度的RDL,同时对于高速的信号具有更低的传输损耗。现阶段如果能顺利解决玻璃基板钻孔的问题,将来非常有机会提供一个低成本、高效能的中介层。台积电为此也适时推出经济版的CoWoS-L(local Si),中介层是使用封装业常用的制模(molding)技术。模的中介层内可内埋local Si interconnect(LSI)芯片,提供所需要高密度的RDL,同时也可以内埋其他的主被动元件以及芯片。不过要完成薄、大面积且不碎裂的制模,在工艺上是很大的挑战。CoWoS中的芯片及晶圆中介层会被台积电所牢牢地绑住,外人难以越雷池,因为这牵涉到对终端客户的承诺。至于substrate高速载板,则有机会被多家供应商所分食,而高速载板内有更多的空间,整合内埋所需要的元件。半导体先进封装技术,尤其是CoWoS,未来在延续摩尔定律道路上扮演不可或缺的角色。现在发生的是AI带来的需求,未来在各领域小芯片(chiplet)的整合,都需要这些技术,而且会更多元及多样。在这条道路上,除了制程技术及IC设计的专长外,需要材料力学、结构力学以及散热机制等专长的人共同参与。当more Moore 「山穷水尽疑无路」时,more than Moore提供「柳暗花明又一村」,这一村将带给半导体产业至少再20年的荣景。
不学AI不会输在起跑点?
人工智能(AI)对城市发展有着深远的影响,一般市民和地方产业应该了解如何运用AI。在新竹县政府和新竹县议会指导下,新竹县工业会支持成立了AI产业发展联盟。希望能全面提升新竹县县民、企业和公部门对AI产业转型的认识。联盟成立启动仪式上,所有的音乐、影片和开场歌曲都是由AI数码生成,参与的民众对于AI的发展潜力和表现感到既惊艳又大开眼界。我在大会演讲指出,AI技术发展迅速且多元,平均每两至三个星期就有新技术产出。因此,我希望集结联盟的力量,帮助大家找到产业所需的AI技术,并降低AI机器设备的成本。为了吸引听众的注意力,我在演讲的投影片上写道:「不学AI不会输在起跑点,而是会死在起跑点。」这句话引发了观众的哄堂大笑,但也让大家认真思索AI对他们个人的影响。一般群众分不清判别式(Discriminative)AI和生成式(Generative)AI,因此我以自己的研究为例,说明两者的区别。判别式AI根据输入数据进行分类或标签,经过训练后能识别每个类别特有的模式和特徵,并根据这些模式进行预测。而生成式AI则着重于构建能生成与训练数据相似的新数据的模型,这些模型学习训练数据的潜在概率分布,并从中生成新样本。了解不同AI技术本质,就更清楚如何运用这些技术。新竹县AI产业发展联盟将致力于解决县内重要议题,例如提升新竹县的数码治理,以及帮助中小企业理解并促成AI转型。未来,联盟将通过举办讲座、企业参访、研讨会等活动,甚至是个别企业谘询和技术小聚,来媒合技术与需求,同时协助企业争取中央的计划补助。新竹县政府拼经济是首要工作,而AI更是重要的发展项目,公部门的科技治理应时时贴近民意,透过AI的智能服务,让民众生活更加美好。今年暑期7月份的AI课程在短短不到一周的时间内便报名爆满。未来将针对不同产业需求,加开相关课程,例如劳工如何运用AI科技、如何通过AI改善愈来愈壅塞的交通问题等。甚至将引进认证课程,让企业能深入了解AI转型的技术。欢迎有兴趣的企业夥伴一同加入,共同努力发展先进的县市智能应用。
雷达的趣闻
乌克兰与俄罗斯战争中使用的雷达技术玲琅满目。这些技术涉及监视雷达、防空雷达,以及由双方部署的战场监视系统。这些雷达系统用于侦测飞机、导弹或地面活动的系统。这些雷达技术是哪些厉害人物发明的?麻省理工学院辐射实验室在第二次世界大战时期将电磁波的研究发挥得淋漓尽致,对于雷达(Radar)的发展有不可磨灭的贡献,也产生出多位诺贝尔奖得主,包括创造「核磁共振」这个名词的拉比 (Isidor Isaac Rabi, 1898~1988), 在1937年确实验证原子核的角动量,而于1944年获颁诺贝尔物理奖。薄赛尔 (Edward Purcell, 1912~1997) 与布洛赫 (Felix Bloch, 1905~1983)因发现在外加磁场下,所有物质只要是有奇数个质子或中子皆可以形成共振现象,能发射特定射频信号,而在1952年荣获诺贝尔物理奖。这项发现早期应用在化学物质的检测上。薄赛尔得诺贝尔奖时好像只有发表6篇论文。阿瓦雷兹 (L.W. Alvarez, 1911~1988) 因制成第一部质子直线加速器,以及对基本粒子研究发展的贡献,而荣获诺贝尔物理奖。冉济(Norman F. Ramsey, 1915~2011) 发展出分离的震荡场方法及其在氢迈射和其他原子钟上的应用。第二次世界大战期间列强的战争需求使得先进科学技术得以快速的发展,于是雷达就出现了。大战期间,德国空军老是跨海轰炸伦敦,让英国烦不胜烦,急需一种探测空中金属物体的技术,能在反空袭战中帮助查找德国飞机。雷达的最早构想来自于沃森瓦爵士 (Sr. Robert Watson-Watt, 1892~1973),希望与美国携手合作,共同打击德军。于是上述这群伟大科学家的电磁波研究集中火力,在战争时期发展出地对空、空对地搜索轰炸、空对空截击火控,以及敌我识别功能的雷达技术,德军闻之丧胆。战后雷达有多项民生应用。例如微波炉(所谓的「雷达烤箱」)深受家庭主妇喜爱;雷达测速器则成为汽车超速者的克星。沃森瓦开车超速曾被雷达测速器抓到罚钱,对于自己推动这项发明的应用,反让他自食恶果,啼笑皆非。 
西瓜熟了没?拍打西瓜的AI
在西瓜的商业生产过程中,农民必须在收获后迅速评估水果的成熟度,根据可食用时间分类,以减少损失。这个过程提升市场销售和生产力,但传统的西瓜测试方法通常不可靠。当你购买西瓜时,成熟度测试是一个有趣的「仪式」。一般家庭主妇将西瓜成熟度分类为2个等级:未成熟和成熟;农夫在西瓜田的识别则分为3个等级,包括未熟类(不要碰)、成熟类(作为商品选择)和过熟类(需要丢弃)。许多人分享他们测试西瓜成熟度的经验。其中最具创意的一个方法是使用稻草技术,将一根稻草水平放在西瓜上。成熟的西瓜会使稻草旋转45度,而未熟的西瓜则保持静止。这种说法认为稻草的运动是由西瓜内部的电力作用引起的。我多次尝试这种方法未果,只好放弃,改变方向,研究其他方法。虽然像拍打、颜色检查和计日等手动技术具有实用性,但其准确性依赖于主观判断。目前,普遍使用的方法是通过拍击声音来评估西瓜的成熟度。这种拍打技术出奇地具有逻辑性,因为产生的声音提供了足够的成熟度指标。然而,对这些声音的个人解读受主观经验和传统智能的影响。我思考是否能利用AI及物联网(IoT)来进行大量快速的西瓜成熟度的拍击评估。在我研究团队的辛勤工作后,提出WatermelonTalk技术。这是一个基于物联网的实时深度学习平台,专为声学西瓜测试设计。我们还引入了「拍打合奏\(tapping ensemble)的概念,显着提升预测准确性,这在文献中尚未出现。我们邀请农友种苗公司的专家将343个品种的1,698个西瓜按成熟度分类,利用深度机器学习,首次探讨四级测试,其中将三级测试中的未成熟类进一步细分为未成熟类和半熟类。比起未成熟类,农民更关注半熟类,须确保对其进行比未成熟类更频繁的测试。这样做是为了防止这些半熟西瓜在下一次测试时过熟。我们的研究在三级测试中达到97.64%的测试准确性,而在四级测试中达到94.07%的显着准确性,这是声学框架中的最佳结果。三级测试可供消费者在购买西瓜时使用,而四级测试则作为农民专业生产的工具。西瓜有不同的成熟程度,选择适当的成熟度会大大影响西瓜的味道和质地。在收获后迅速评估水果的成熟度,通过可食用时间进行分类,可显着降低收获后的损失。因此,WatermelonTalk帮助农民仔细衡量西瓜的成熟度,提升市场销售和生产力,彰显AI对日常生活的贡献。关于技术的详细信息,请参阅Yun-Wei Lin, Yi-Bing Lin, Wen-Liang Chen, Chia-Hui Chang, and Han-Kuan Li, Watermelons Talk: Predicting Ripeness through Tapping, 将刊登于IEEE Internet of Things Magazine。
英特尔怎麽了?
英特尔(Intel)近期负面消息不断:市值已经跌到半导体类股的第十名,是台积电的5分之1;晶圆代工业务持续扩大亏损;先进制程发展不顺;高通(Qualcomm)抢先与微软(Microsoft)合作推出AI PC的芯片。这一切在十年前,甚至五年前都是无法想像的事,英特尔到底怎麽了?英特尔CEOPat Gelsinger,上周在台北的COMPUTEX发表主题演讲。演讲是以击鼓演出开场的,颇有对这些负面信息,采取鸣鼓而攻之的味道。Gelsinger以摩尔(Gordon Moore ),在早年提出摩尔定律时所说的一句话开始,「Whatever has been done, can be outdone」,也就是说「过去不论完成了什麽,都是可以被超越的」,他相信自己是在做件超越前人的事,包括要在4年中完成5个先进制程节点。凭心而论,就个人的观察,英特尔还是一家非常有创新能力的公司。过去不少英特尔的创新是在创造一个产业生态,引领整个半导体界往前迈进。比如说,在90年代英特尔率先提出12寸晶圆平台,2000年代又接着倡议18寸的晶圆;为了PC的无线网络,提出WiMax架构;而Lightpeak是为了解决PC的有线高速信号传输;在封装上,与日本的味之素共同开发ABF材料;最近被讨论甚多的玻璃载板,以取代现有的高速载板,也是英特尔在多年前所提出的;为了解决芯片功耗过大的问题,英特尔率先提出芯片背面供电(backside power)的想法,为目前最有潜力的解决方案;甚至EUV的微影技术,也是英特尔首先赞助的科研计划。即便台积电轰动武林的CoWoS,英特尔也有EMIB(embedded multi-die interconnect bridge)的技术来抗衡。上述这些林林总总,如果没有英特尔的创新与推动,整个半导体产业也许还停留在石器时代,绝非现在的样貌。这麽一家创新又技术领先的公司,是发生了什麽事,造成今天的局面?首先,英特尔在最近的20年间(2005~2024)已换了4任的CEO,任期远短于先前摩尔在位的12年,以及Andrew Grove的11年。除了Gelsinger为技术出身外,其他3位都出身于营运或者财务。其次在整个半导体产业的生态改变,尤其是先进制程,7纳米制程节点是一个关键。在2010年初期,全球在开发7纳米技术,都遇到相当的瓶颈。首先若延袭既有浸润式DUV技术,在关键的微影制程,需要经过3次到4次的曝光程序,既费时又费工。当时的EUV,虽然只需1次的曝光,但是由于光的强度不足,每小时晶圆的产出远低于100片,量产上遭遇困难。整个产业弥漫着悲观氛围,认为技术已经遇到天花板了。换言之,在资源上的投入就不再这麽积极。最后也是最为关键的是,英特尔是家IDM的公司,有自己的产品。在这段期间英特尔先后并超过10家公司,比较大的购并案包括Altera (FPGA芯片),Mobileye (ADAS,车用自驾芯片),Habana(AI芯片)等。由于先进制程遭遇到瓶颈,自然地会考虑到CPU之外的产品线,再加上CEO多出身于营运,自然是忽略在技术深耕上的投入。反观台积电,由于没有自己的产品,唯一的选择,只能在技术上加大力道寻求突破,以及与客户的充分合作。终于EUV的瓶颈打开,加上苹果(Apple)、NVIDIA等重大客户,不断地对于先进制程的需求,最终导致今天英特尔的困境。在COMPUTEX 2024的主题演讲上,Gelsinger卖力地介绍自家Xeon 6 服务器处理器、Gaudi 3 AI加速器,以及AI PC Lunar Lake处理器。其中Gaudi 3以及Lunar Lake是委托台积电生产,分别使用5纳米以及3纳米的制程。这也显示Gelsinger想要超越过去英特尔的积极作为。个人的观察,英特尔还是个相当有底气的公司,Gelsinger的企图心以及有步调、弹性的作为,若能假以时日,势必会威胁到超微(AMD)甚至NVIDIA。美国政府也一定会全力来支持英特尔,因为英特尔是唯一拥有半导体先进制程能力的美国公司,而半导体又是全球兵家必争之地。最后,英特尔是否有机会威胁到台积电的龙头地位?值得我们深思。
不只见证科技业历史 我们更是造浪者
不只见证科技业历史,我们更是造浪者。6月5日美股收盘NVIDIA市值正式超越苹果(Apple),成为全球第二大市值公司,全球媒体要请黄仁勳评论此事时,都不得不提到他正在台湾参与COMPUTEX。除了NVIDIA自己的活动外,他站台、观展、四处吃饭逛夜市,用国台语跟产业与民众搏感情。除了情感上因有这麽一位出生于台湾、又高度参与台湾社会的科技领袖而与有荣焉外,更可贵的是,我们不只见证这历史转折的关键一刻,更深度参与其中!若回顾全球前十大市值业者的转变,从2009年年末市值来看,微软(Microsoft)与苹果这两家科技业者位居第二名与第六名,前者主宰着PC OS与生产力软件市场,后者于2007年推出iPhone正处于开创智能手机时代的上升期,此外拥有全球最大移动电话用户群的国内移动列名第七,但整体来说多数入榜者仍是属于石油、零售、金融、医疗保健、及食品等旧经济各领域的龙头业者。若观察2018年3月底、美中贸易战开打前的市值排名,仅有Berkshire Hathaway、JPMorgan Chase、与Johnson & Johnson这三家非科技公司入榜,其余七家均是美中BigTech业者,分居市值第1~5名及7~8名,依序是苹果、Alphabet、微软、亚马逊(Amazom)、腾讯、阿里巴巴、Facebook。这反应新经济的大幅扩张、2C端垄断性网络平台的市场地位(手机OS、查找、社群等)及2B端云端服务发展的方兴未艾。若就2022年底的市值来看,此时ChatGPT虽已于11月底推出,但生成式人工智能(generative AI)的颠覆性风潮仍未在资本市场充分反应,排名中腾讯与阿里巴巴跌出前十,反应外部美中霸权角力下美国对国内的抑制,及内部国内国进民退政策方针下,扩大监管网络巨擘的双重压力,而Tesla跻身第七名则意味着碳中和/ESG趋势下电动车的商机潜力及对创始人Elon Mask「火星人」般愿景下事业布局的期待。随着科技典范转移来到了当前的生成式AI浪潮,最新的市值排名中,科技业者分居1~5、7、9名,其中OpenAI最大股东及将GPT全方位导入己身各项服务的微软位居第一,而NVIDIA市值在相继超越Meta、亚马逊、Alphabet后,于6月5日收盘首次超越苹果,成为第二高市值公司。苹果曾多年维持全球市值龙头,2024年陆续为微软及NVIDIA所超越,这不仅反应谁是引领生成式AI浪潮的主导者,也正式宣告智能手机 / 移动联网时代的落幕。从2009年的微软与苹果,到最新市值前十大中的所有科技业者,多年来始终都需要以台积电为代表的台湾供应链。从AI加速器芯片到AI服务器,再到数据中心解决方案,再到AI PC,没有我们,加速运算没法加速、生成式AI应用没法落地。很高兴NVIDIA创造历史时正好恰逢COMPUTEX期间、正好黄仁勳人在台湾参与其中,我们是每个时代科技领袖身后的造浪者,过去我们往往不被看见,但如今,整个世界看到我们的贡献! 
三星电子涅盘再生,容易吗?
面对低迷的2023年,三星电子(Samsung Electrinics)营收跌落到2,000亿美元以下,最后一季的营收大约是500亿美元,获利20.8亿美元,营益率不到4.2%。已经有分析机构预测,如果三星在2024年没有起色,以果敢投资闻名的三星,将会面对财务规划上的风险。现在,2024年第1季公布的暂订财报显示,三星获利48.9亿美元,较上一季(QoQ)的20.8亿美元超出甚多。我们看不见手机、消费电子有太大变动,半导体转亏为盈才是关键,而前后的盈亏差异更可能高达50亿美元,难怪三星半导体前社长庆桂显说,三星半导体的获利将回到2022年的水平。如果从过去的历史经验,参酌最新一季公告的数据,或许我们可以更深入理解三星在调整经营决策上面对的挑战。在2023年最后一季,三星的营收中,有32%来自以半导体为主力的DS部门,以品牌为主的MX部门贡献比例最高,其中手机更是关键。由于最后一季三星手机销售拉出尾盘,上市不久的S24系列获得好评,2023年第4季的手机销售量达到5,700万支,也让MX部门创造出不错的获利。回顾过去几年三星的营收与获利结构可以理解,面板与消费电子(以电视机为主)已经成为鸡肋,影响不了三星的营收与获利结构。三星在55寸以上的高端电视机市场,全球市占率过半,但2023年最后一季消费电子却是小赔。我们可以说电视机只是三星品牌送进高所得家庭的代理、工具而已,对集团的获利挹注不大。与三星竞争半世纪的乐金(LG),在电视机市场上也是能与三星等量齐观的顶尖大厂,但现在LG也不再强调电视机的质量,而是将重心放在智能家庭上。不仅LG如此,三星必然也会加紧布局,以电视机成为智能家庭的枢纽,但这将牵涉到多元的内容服务与系统整合能力,而这正好是韩国厂商的罩门。除此之外,过去三星集团营收中,大约1/3的营收来自半导体,但获利却有2/3是半导体部门的贡献。以手机为主的品牌销售部分正好相反,营收贡献2/3,但获利却仅有1/3。当三星2023年的获利仰赖传统的手机,而传统的手机市场趋于饱和是无可挽回的大趋势,对三星而言,整合手机与半导体的能量,建构AI手机的市场地位乃是当务之急,因此重拾HBM的领先地位就非常关键。过去三星半导体部门营收、获利主力是存储器,在DRAM与快闪存储器(Flash)两大主流中,DRAM是寡头竞争,三星、SK海力士(SK Hynix)与美光(Micron)很自然的还有自我调节功能,市场秩序与价格相对容易控制,但Flash Memory却是多家竞争,且在高带宽存储器(HBM)商机上,SK海力士比三星更早布局。对三星而言,现在最有把握的是DRAM市场的商机,只要NB、手机市场回温,自然可以调高售价,赚取更多的利润。但单押传统的DRAM,只以经济规模取胜,绝非三星这种2,000亿美元等级的企业可以持盈保泰的经营策略。短期内持续布局逻辑系统芯片(System LSI)是必然的趋势,但更重要的是如何因应未来5年、10年以人工智能(AI),参酌地缘政治的大环境下,三星如何调整经营策略将是这一波AI大潮背后最值得观察的课题。很多人说,台积电最大的风险就是「地缘政治」,这样的说法同样适用于三星。如果我们知道三星半导体的营收一半以上集中在海峡两岸,看似竞争对手的台湾其实是三星很大的客户,反而国内的华为将三星列为假想敌,三星在国内手机市占率从20%一路暴跌到1%以下,这件事不是偶然,三星必然会记取教训。当尹锡悦当家的韩国说要成为全球AI的三大强权之一时,剑指的对象就是国内,而AI与网络、云端服务都是「霸权」之争,以大集团为主的韩国企业,在升级转型的路上,面对的困难远高于台湾。
AI解析音乐与尼采如是说
我以AI物联网分析音乐,并利用其结果来驱动乐器的演奏,称之为MusicTalk。接下来就想训练大型语言模型(LLM),将文字与音乐互换,再将音乐用来诠释影像。最大的应用是电影配乐。要将音乐智能化以配合影像,科技人必须对音乐的内涵有深入的认识。例如电影的配乐最让人印象深刻的是1968年电影《2001太空漫游》(2001: A Space Odyssey)中用史特劳斯(Richard Strauss, 1864~1949)演绎《查拉图斯特拉如是说》(Thus Spake Zarathustra)这首乐曲的开场。《查拉图斯特拉如是说》是尼采(Friedrich Wilhelm Nietzsch, 1844~1900)的作品。它不同于一般哲学作品,而是以散文诗完成。尼采曾表示这本书实际上是一部「交响曲」,以一种伪圣经风格撰写,它包含许多含糊不清且充满诗意的神秘箴言。我没读通这本书,肤浅了解其主要思想是,人类应该拥抱生活、自然、身体和物质存在,包括其中的乐趣和痛苦,而非寻求超越或来世的精神世界。生活即使伴随着所有的苦难,还是值得为了它的存在而生活。许多艺术家和作曲家受到《查拉图斯特拉如是说》的影响,但很少有人像史特劳斯那样深切融入尼采的哲学观点。1896年时32岁的史特劳斯开始创作 《查拉图斯特拉如是说》乐章。当时尼采因三期梅毒的感染,已精神失常。史特劳斯将自己作品的各个部分以尼采书中不同章节命名。他尝试将尼采抽象的文字清晰地翻译成同样抽象的器乐音乐。该作品在完成后几个月内进行首演,其华丽的编曲、复杂的音乐纹理、大胆的和谐和具争议性的主题,引发激烈的批评和喝采。《2001太空漫游》使用这首乐曲开场为外太空的日出配乐,符合史特劳斯描绘尼采书中开场的山顶日出情境。开场中的小号旋律呈现「自然」或「世界之谜」动机;它在整个乐曲中反覆出现,象徵着大自然的冷漠和神秘性: 在强烈的开场之后,号角的回应是一个宗教式的旋律,由分散的弦乐器精彩演奏。开场时音乐从柔和到逐渐增强,象徵着人类对一个完美、天堂般、精神上的自然替代的渴望。有了《2001太空漫游》的例子,我尝试以MusicTalk反推史特劳斯的音乐,想找出他想表现的意涵,却遭遇极大困难。史特劳斯曾经开玩笑地说,他可以在音乐中诉说一切,即使人们无法理解,我就是那位无法理解的人,妄想以物联网驾驭史特劳斯的音乐。《查拉图斯特拉如是说》太过深奥,AI处理不来。我决定放弃好高骛远的做法,由小朋友听得懂的《彼得与狼》训练MusicTalk,总算有初步成果。这是一个基于物联网的创新音乐乐器检测系统。MusicTalk 引入了一种名为亮度特徵基础Patchout的新颖机制,以提高乐器检测的准确性,并超越现有解决方案。MusicTalk首次系统性地将单个乐器检测器作为物联网设备进行整合,为与其他物联网设备的交互管理提供有效的方法。我们在MusicTalk中引入一个通用音频整形器,融合各种音乐公开数据集,如Audioset、OpenMIc-2018、MedleyDB、URMP和INSTDB。我们利用Grand-CAM分析Mel-Spectrograms来优化 MusicTalk中ViT Patchout和CNN的组合,以实现前所未有的准确率。例如,小提琴检测的精确率和召回率分别达到96.17%和95.77%,这是所有方法中最高的。此外,MusicTalk 的另一个优势在于其基于物联网的视觉化能力。通过将乐器检测器作为物联网设备整合,MusicTalk能够使用动画Avatar来无缝地视觉化歌曲。透过《彼得与狼》为例的案例研究,我们证明,改进的乐器检测准确性增强音乐的视觉叙事效果。与先前的方法相比,MusicTalk在这首歌曲上的F1分数提高12%。然而,我念念不忘的是,我们训练AI模型,何时能如同史特劳斯,了解尼采的想法。MusicTalk仍有很大的改进空间。 
台韩半导体业「有点黏」的连动关系
半导体产业是外贸韩国的命脉,2023年韩国出口半导体1,310亿美元,进口1,060亿美元,顺差250亿美元。对外汇存底雄厚的台湾而言,贸易逆差是帐面数字,但对2023年底时外债达6,636亿美元的韩国而言,外贸出现逆差时,那是沈重的负担。而半导体正是挑起贸易平衡重担的核心产业,一旦半导体不再获利,韩国将面对极为严重的后果!本文将从韩国海关公布的韩国半导体出口结构、主力产品两大方向探索韩国半导体产业的现状。从帐面上的出口结构观察,韩国出口的半导体,35.8%直接销往国内,销往香港后最可能转往国内内地的比例是14.1%。除了这两大出口目的地之外,越南的12.3%与台湾的8.7%分居第三、第四,排名第五的是美国的8.1%,其余国家相对比重较低。由于韩国的存储器占全球8成的比重,从韩国存储器的出口结构,大致也可以找到解读全球供应链变化的线索。国内+香港正好贡献韩国出口的50%,虽比2022年略减2%,但依旧是出口主力,而之后得越南、台湾合计是20.4%,前四大出口市场合计70.3%,但关键不是出口国,而是到底谁买了、用了这些半导体?以台湾零件代理商的出口结构、客户结构判断,国内客户的比重已经从6成降到5成,台湾回升到35%,而东协国家也同步上扬,显示美国的出口禁令,已经深度影响从韩国半导体原厂到台湾零件代理商的销售结构。除了三星电子(Samsung Electronics)自用之外,在国内、香港、台湾、越南市场流动的各国半导体,有80%以上是卖给台商、陆资大厂的,一旦台海生波,南朝鲜之间的38度线不会平静的!当台积电被戴上地缘政治的大帽子时,三星的压力不会比较小!与此同时,韩国也进口很多的半导体,来自国内、台湾、日本的半导体分居前三名,但真正的两大逆差国是日本与台湾。来自国内的半导体很多是三星西安与SK海力士(SK Hynix)无锡工厂的贡献,主导权仍在韩厂手上,至于从日本进口的是设备、材料,包括曝光、长晶、蚀刻等设备,但从台湾进口的却是实打实的半导体。除了跟联发科等台湾IC设计公司进口逻辑芯片与驱动IC之外,联电、旺宏、华邦也都是韩国的供应来源。其实三星、SK海力士擅长高端的存储器,韩国进口的微处理器与驱动IC竟然有45.2%来自台湾,这与大家一般的印象并不相同。从这个结构观察,您认为「三星有灭台计划吗?」,三星我们如何在G2/AUKUS架构下,重新理解台韩之间的产业竞合关系呢?
生成式AI非泡沫 2030年1.5万亿美元商机可期
生成式AI(Generative AI)是AI领域中的部分子集合,未来5~10年全球经济成长最关键的驱动力量之一就是生成式AI。DIGITIMES研究中心于2024年5月完成「生成式AI引领应用与硬件新商机—超前布局未来1.5万亿美元市场」专题报告,内容即涵盖三大部分,分别为「生成式AI技术崛起」、「生成式AI运算力发展,从云到端」、「生成式AI应用领域案例」等,针对生成式AI最新关键趋势完成一系列研究。根据DIGITIMES研究中心预估,2022~2030年全球生成式AI市场复合年均成长率可望超过80%,在2030年达到1.5万亿美元规模,就服务、软件及硬件三大组成来看,2024年硬件(主要以生成式AI服务器为代表)占生成式AI市场最大比重。随着各垂直领域百花齐放、应用面更为普及风潮下,预估至2030年时,服务将跃居整体生成式AI市场超过一半的比重。许多专家将生成式AI的浪潮及其影响比拟为新时代的网际网络(internet),确实网际网络以其广泛的应用以及扮演重要基础建设的角色,对许许多多产业带来深远的影响,Google、微软(Microsoft)、亚马逊(Amazon)、Meta、苹果(Apple)、阿里巴巴、百度等众多新兴企业掌握住此一潮流已成为举足轻重的产业巨人;同理,生成式AI也不会只是短期噱头(hype),而是会实实在在地影响我们及所处企业、产业及社会未来发展的重要力量。生成式AI今后发展的三大关键—模型、运算力、数据。模型方面,从2023年着重云端大参数量大型语言模型(LLM),2024年增加对边缘小参数量LLM的关注,以因应为符合边缘装置较低运算力及存储器带宽的先天限制,云端大参数量LLM则扩及多模态LLM,领先业者跟跟进业者差距有所拉开。运算力方面,云端服务器AI运算芯片成长可期,值得关注生成式AI应用从云扩及到端,2024及2025年AI NB及AI智能手机出货量及渗透率可望快速攀升,指标芯片业者纷推出可运行边缘生成式AI推论的芯片,为提升芯片AI运算力,目前以整合神经网络处理单元(Neural Network Processing Unit;NPU)加速器为主流。此外,边缘运算包括物联网等应用区隔,AI的影响力也将日益显着。训练数据部分,目前指标LLM业者使用英文为主要训练数据,而繁体中文训练语料的数量,远比不上简体中文,目前繁体中文训练数据成为模型训练的一大课题。在生成式AI的应用案例方面,本篇专题报告探讨从智能交通、智能零售、智能医疗、智能制造以及智能家庭五大类别,以生成式AI普及的速度来看,不管是零售、制造或是家庭生活、移动应用,都有庞大的商机,各种应用情境在2024年开年以来的国际展会包括CES、MWC以及嵌入式电子与产业电脑应用展(Embedded World)、车电展等,都可以感受到此一趋势。(作者为DIGITIMES研究中心研究总监)