AI也难突破哥德尔不完备定理
哥德尔(Kurt Friedrich Gödel;1906~1978)在现代逻辑上的成就是独特而伟大的。事实上,哥德尔的成就不仅是一座学术纪念碑,更是长久屹立于学术历史中的地标。逻辑学科因为哥德尔的成就而彻底改变其本质与发展可能性。在哥德尔的伟大成就中,他的不完备定理(Incompleteness Theorems)是数理逻辑中的基本结果,宣示形式系统的内在局限性,尤其是那些能够表达基本算术的系统。第一定理表明,任何足够强大且一致的形式系统都不可能完备,这意味著该系统内会有无法使用自身证明的真命题。第二定理进一步指出,没有一个系统能够证明自身的一致性。大型语言模型(LLM),如GPT-4,可以协助数学定理的证明,但与传统方法相比,它们仍有明显的限制。这些模型可以提出想法、建议步骤或提供解释,这些都可能在证明构建过程中发挥作用。它们能处理某些符号运算并形式化某些证明,特别是那些遵循已知模式或来自数学文献中的证明。然而,LLM无法从零开始进行复杂或新颖定理的深度推论,因为它们的回应基于数据模式,而非形式逻辑推导。一些专门设计来证明定理的AI系统,如Coq、Lean和Isabelle,依赖严格的形式逻辑,并能生成完全角式化的证明,且这些证明可经过验证确保其正确性。相比之下,大型语言模型缺乏对逻辑和数学结构的形式理解。然而哥德尔的定理表明,某些真理无法由这些AI系统确立,且复杂系统的一致性无法从系统内部证明。AI无法「打破」哥德尔定理,因为这些定理是逻辑学的基本结果。它们适用于任何具有一定复杂性的形式系统,并且已被证明无误。由于AI运行依赖形式逻辑,它同样受到哥德尔不完备定理的根本限制。尽管AI无法打破哥德尔的定理,但它能帮助探讨这些定理的影响,模拟不同的逻辑系统,并研究这些限制在各类数学框架中的具体表现。然而,AI无法独立证明复杂或新颖的定理,也无法突破哥德尔不完备定理所设下的限制。哥德尔说:「我只相信先验的真理。世界的意义在于愿望与事实的分离。数学要么对人类心智而言过于庞大,要么人类心智不仅仅是一部机器。事物本身与谈论事物之间是有区别的(I only believe in a priori truth. The meaning of world is the separation of wish and fact. Either mathematics is too big for the human mind or the human mind is more than a machine. There is a difference between a thing and talking about a thing.)在AI的协助下,我们或许能够进一步探索数学的深邃领域,扩展人类心智的理解范围。
德国观察(6):历史不仅仅是历史
领带不见了,皮鞋也不见了!从硅谷到柏林、司图加特,几场大型的会议活动,我没看到有人穿著皮鞋上臺讲课,蔡司发给每个员工一双白球鞋与贴身的蔡司背心供大家識別服务人员。不仅如此,现场几乎没有人戴著领带,那么现在做皮鞋的Bally,浙江嵊县的领带王国如今还好吗?消费行为改变时,可能就是行业生死存亡的关头。但有些东西就是不可或缺。蔡司总裁说,地球上的人都是我们的客户,也许他用的手机镜头,或者微创手术时的显微镜,甚至您坐在牙医的诊疗椅上时,牙医已经可以同步与病患透过蔡司的3D镜头相互沟通。蔡司改变的不是光学技术,而是光学技术与我们之间的关系。蔡司不再是一家只生产镜头的公司,1969年人类登陆月球时有蔡司的镜头,现在的EUV设备少不了蔡司,而全世界已经有超过1,000万人进行眼球的微创手术,更是造福人类的伟大事业。离开司图加特之前我们去参访奔馳(Mercedes-Benz)总部,上百辆横跨接近150年的经典车款,在最亮眼的灯光下,沿著螺旋状的博物馆逐层展示他们的风华。奔馳汽车创始于「美好时代」,在欧洲,人们称1880~1914的30多年是「美好年代」,除了动力马达的普及之外,量产技术在稳定的欧洲世界创造出庞大的市场需求。都市化带来新商机,人们开始思考更有效率的跨区、跨国服务。1898年的巴黎万国博览会除了兴建艾飞尔铁塔之外,更重要的时代意义是让各国的商品公平的呈现在世人面前。奔馳汽车一炮而红,而深具工匠精神的普鲁士文明,给德意志联邦带来自信与骄傲。我们在奔馳博物馆看到的不仅仅是150年来所有的经典车款,也领悟到科技文明的变迁。但真正让德国汽车工业站上世界顶尖地位的关键,在于1960年以后的黄金時代。1957年,德国、英国、法国、意大利与荷比卢等主要的工业国家在罗马聚会,确认将以「欧盟」的形式建立关税同盟与共同市场,这是让德国汽车工业真正建立经济规模的年代。听说Carl Benz开发出第一臺汽车时,他自己并不看好,反倒是他的夫人开著他的创作,走走停停的走了18公里回娘家。回娘家那一段路,是人类历史上足以加載史册的大跃进。全球热门的话题当然是「人工智能」,但市场的结构与传统的工业时代已经大相径庭。如今攀顶的企业追逐不是工业时代的市占率,而是市场上绝对领先的独占性。基本上全球市场的规模稳定成长,只是市场大饼多数被领先者攫取,唯有具有独特制造优势的企业,才可以在特定领域繁衍生息。从Google、Facebook拿走媒体的广告商机,Tesla的电动车、NVIDIA的AI Accelerator,我们都看到领先者毫不留情的掠夺,资本主义的极致戏码正在上演,市值上萬億美元的企业主宰了市场。一旦企业界掌握太多他们也不需要的资源时,政治人物就可能利用各种机制调节资源的分配。历史不曾重复,只是经常以类似的情境再度出现而已。
德国观察(5):工业级的數字分身計劃:From AI Factory to AI Solution
「品质」是所有制造业的基础,企业从研发部门启动产品計劃开始,历经生产部门、供应商与客户的共同努力之下,达成六个标准差的要求,最后以「零失误」为目标将产品展现在消费者、用户面前。面对少子化、产品多样化的现实议题,制造厂如何利用生产管理技术,确实达到零缺点的无人工厂新境界?富士康、广达、纬创等EMS制造大厂,在过去五年的员工人数大减,又强调「非PC」营收比重、毛利、净利同步上扬的背景背后,智能制造的贡献就是幕后英雄。在柏林蔡司创新高峰会的现场,富士康數字长史喆讲述富士康智能工厂的布局策略。简而言之,富士康以AR/IR/MR的技术为基础,复制连结所有的工厂生产数据。富士康相信,拥有全球最多數字生产工具的富士康,只要尽可能将所有的生产活动数据化,就可以相互学习,并且在新建工厂时避免错误,并拥有最大的生产效益。「數字学习」不仅仅在于个别的消费者、用户,更大的意义在于工厂自动化,以及善用数据的管理机制。在2019年疫情之后的这五年,臺商基于规避风险、返臺投资等多重考量,对于智能制造的觉醒,扩大了与新兴竞争国家之间的距离。原本领先的臺湾加速往前扩张,现在要面对的课题,早已经不是技术问题,而是基于地缘政治、产业转型的决心与战略议题。富士康拥有全球规模最大的电子产品生产体系,但也最容易面对少子化、产品多元化的压力,从生产的角度发展出數字分身布局,非常值得大家学习。除了以網絡服务包抄市场的巨擘之外,以制造为本的企业成为市场上不可或缺的要角。只要市场存在一定的规模,制造与产品供应商,反倒是实际创造普世价值的英雄。聘用大量制造业人力的臺商如此,拥有4.3万名员工,不断在光学领域攻坚,试图突破技术瓶颈的蔡司不也如此吗?疫情肆虐期间,蔡司营收一度跌到60亿欧元,蔡司的营收在五年之后又倍增到100亿欧元以上,总部厂区里很多新工厂正在动工,证明了这是一家欣欣向荣的企业。做为全球最成功的「工匠」,我们看到制造业的价值,也以能与全世界分享而自豪!
德国观察(4):从已知到未知
半导体事业是从1970年代初期开始的,如今是蔡司(Zeiss)四大部门中规模最大的。在集团总裁佩澈(Andreas Pecher)亲自安排下,我与广达品质长魏智章到生产半导体EUV设备的工厂会见蔡司技术长史坦乐(Thomas Stammler),在技术长的导览下,看到不可思议的镜片。能在第一线聆听最顶尖的专家对于全球半导体技术趋势的看法,入宝山、不空回是难以言喻的幸福感。大师一席话,印证许多二手看到的数据數據。我们都知道EUV设备造价昂贵,而其中3分之1的成本是蔡司的光学技术,蔡司也是半导体科技往前迈进的关键。穿上无尘衣,走进科技业恒温、恒湿的最高殿堂,眼前是个制造物镜系统的大型模具,以及各种自动化生产设备。我不是专家,不敢班门弄斧,只能在制造高精度镜头的设备前留影,证明自己曾经到此一游。我在参访博物馆时,看到与传统鏡頭并排的大型微影机,领悟到科技都是渐进式的演化,蔡司只是把传统的鏡頭镜头做到更大、更精细而已,类似互聯網或量子技术、人工智能这种颠覆性的革命其实并不多见。所以,我们是从「已知走向未知」已经有178年历史的蔡司,从1970年代初期参与半导体设备的研发,EUV设备也是超过10年的努力与挫折之后才有的成果。EUV设备有三大核心技术,除了光源技术之外,就是蔡司的高精度镜头与德国另外一家大厂创浦(TRUMPF)的精密仪器。对我而言,以光学技术持续探底是「已知」。但今天每个人在探索物理的极限时都抱持著谨慎的态度,因为我们面对的是个错综复杂「未知」世界,更好的AI加速器使得电脑运算的极限难以预测,各种仪器、曝光技术也在AI加持下出现难以预测的可能性。我问复制EUV设备的可能性有多高,可能的方法又是什么?史坦乐笑著说:「5年、10年,甚至20年」。过去是「线性」的竞合关系,未来却是多元交错的产业生态系。领先者不断以自己拥有的技术,结合策略伙伴,可以轻而易举的扩大领先差距。新一代产品是刚刚进厂,造价3.8亿美元的NA EUV,那么再下一代呢,也许会在2030年前后上市。从技术创新的角度观察,弯道超车是「梦」,弯道翻车却可能是「现实」。10年、20年后,我们面对的是结合人工智能、量子技术新时代。您自认的一大步,也可能只是现实世界里的一小步而已。也许有人做得出来,但在商业运转上也可能难以为继。我再次体会,軟件应用平臺与硬件制造业之间的明显差距。
德国观察(3):穿越时空,回到过去
进入AI时代,NVIDIA、微软(Microsoft)、苹果(Apple)、AWS、Tesla等八大公司不仅攫取大量资源,还意图独占市场。但只要市场维持稳定,全球科技产业中仍有两种公司会赚钱。第一种是无所不在,又不可或缺的臺商。第二种是拥有特殊技术,在专业领域不可或缺的公司,蔡司(Zeiss)就是很好的典范。一家创办178年的企业,至今屹立不摇,必然有很多技术与企业文化上的遗产(Legacy)。久仰蔡司盛名,亚洲人最想知道在这178年中,蔡司经历过几次重要的转折?他们是一家获利丰厚的公司,但为何维持以「基金会」做为管理主体的私人企业?从纳粹德国到二战结束的东西德分裂,及1989年柏林牆倒塌之后,东西德的蔡司再度二合一,经历过哪些高难度的挑战?您能想像100多年前的公司有社会福利、休假制度吗?卡尔蔡司(Carl Zeiss)在1846年创办生产制造显微镜的蔡司,几年后他邀请物理、数学家阿倍(Ernst Abbe)加盟,两人不离不弃的开疆拓土,成为蔡司成长茁壮的共同創始人。1888年,創始人Carl Zeiss过世,阿倍在次年以Carl Zeiss之名成立基金会,让蔡司这家未上市公司,关注员工的工作权与相关福利,进而成为社会共有的企业。1912年,蔡司跨出显微镜的舒适圈,开始生产鏡頭,并将镜片事业扩展到不同领域的应用。蔡司的发展过程并非一帆风顺,1933~1945年由纳粹掌握的德国疯狂扩张,并将所有的资源投入战争。除了奔馳(Mercedes-Benz)之外,BMW为德国战斗机制造引擎,据说BMW的蓝白徽灵感就是来自战斗机飞行员看到的天空。Carl Zeiss来自东德图林根州的耶拿大学,可以想像原本蔡司的重心在东德。但在二战结束之后,德国的工业被拆解成两份,蔡司在东西德分裂前夕从东德连夜抢到77名顶尖的工程师,并将总部设在西德司图加特附近,人口不到1万人的上科亨,让这些工程师迅速的成为西方阵营成员。蔡司经历了纳粹德国的威权时代,东西德分裂又统一的两次世纪大考验,1991年的东西德蔡司合并成一家公司,但光是东德蔡司就有1万名员工,这些意识形态不同,都是光学的专家,整合上的难度必然高于一般的合并案例。从管理学的角度,合并的成功就是蔡司呈献给人类最伟大的资产。蔡司员工毫不掩饰自己对公司的喜爱,就像热爱自己的国家一样,这种几乎是与生俱来的情感,也来自经营者的心态。
川普二进白宫下的臺积电避险策略
川普(Donald Trump)二度当选为臺积电未来的营运带来高度不确定性。事实上,当美国2022年10月祭出出口管制,压制中国先进制程的发展,及2024年陆续传来英特尔(Intel)与三星电子(Samsung Electronics)的营运警讯,虽让臺积电在先进制程市占率持续提升,但也大幅提高在地缘政治及产业垄断课题上的风险,如何在川普二进白宫的四年降低本身的经营风险呢?我认为首先必须在企业愿景及产业定位做出调整:臺积电的愿景:成为全球最先进及最大的专业集成電路技术及制造服务业者,并且与我们无晶圆厂设计公司及整合元件制造商的客户群共同组成半导体产业中坚强的竞争团队。臺积电的使命:作为全球逻辑集成電路产业中,长期且值得信赖的技术及产能提供者。依当前的时空环境,臺积电的使命仍然合适,但愿景中「最先进」、「最大」、「竞争团队」这些字眼可就敏感了。作为实质无可替代的半导体制造服务龙头,愿景应已不需再著眼自身,而是从更宏观格局的半导体生态系、科技产业及科技应用生态系,乃至于当前人类社会科技文明的发展来思考,从一个关键enabler的角色,提出一个新的愿景与产业定位。基于这样的愿景与定位,衍生出与各国政府、学研界、产业界相关的合作推动项目,例如半导体人才培育、促进高影响力新兴科技发展等計劃,让臺积电不只是透过服务客户对科技发展做出「间接」贡献,而是透过与国际社会各利害关系成员的连结合作,让国际社会感受到臺积电更「直接有感」的贡献,化解不必要的敌意与忧虑。就未来四年川普主政的营运风险,相信臺积电内部早已做出种种情境的沙盘推演,我认为必须就最极端恶劣的情境,如反垄断及分拆压力、无法取得最先进设备材料等情况来预先擘划避险策略,才能有更妥善的因应做法。这边试拟两策略作为参考方向。一、 需培养竞争对手适度让利古典吕氏春秋有云「全则必缺,极则必反,盈则必亏」,太盈满必将招致亏损。臺积电独拿先进制程与封装市场,即便到美德日设厂,但缺乏第二供应来源,对美国政府来说,终究是己身半导体产业痛点及国家安全、供应链安全风险所在。昔日英特尔成为CPU霸主时,必须有超微(AMD)存在以作为第二供应来源及维持市场竞争机制。虽力积电广开制程技术授权之门的做法,引起不少争议,但若臺积电采用类似做法,愿意授权其他业者,将可让美国及各国政府心安许多。例如目前臺积电制程处于由三納米转2納米阶段,那么相对成熟的7納米是否可评估授权可行性,不见得授权给英特尔与三星,格罗方德(GlobalFoundries)未尝不是更合适的合作对象。在过去,企业经营仅需追求成长,但这几年地缘政治与黑天鹅事件冲击下,必须同步追求降低风险,甚至对臺积电来说,降低风险比追求成长更为重要。透过培养竞争对手让出部分市场,可有效降低极端风险的可能,而透过授权金的取得,应可适度降低让出市场对获利所造成的冲击。二、 进一步平衡臺美两地布局川普上任后的半年,可能是观察是否其将选举诉求转成实质政策的关键时期,如何利用这段缓冲期化解川普政府的敌意与忧虑,甚至为其塑造政治利多,就成为臺积电必须与川普团队沟通的重点,关键在于对美国的布局是否得进一步加码,淡化美国政府对先进制程与先进封装产能过度集中臺湾的隐忧。若臺积电追加在美投资设厂計劃,在面临庞大资本支出及川普对拜登(Joe Biden)《芯片与科学法案》(Chips and Science Act)补贴金额不认帐的隐忧下,考量投报率与营运风险,不见得是好的做法。那么若设立研发中心呢?臺湾政府近几年有推动外商设立研发中心的政策,例如超微数月前申请的「全球研发创新伙伴計劃」,投资金额为86.4亿元,政府与超微出资比例为38%:62%。而研发人才50%自国外引进,另50%为本地聘用。臺积电过往对于过于未来的研发相对不会过早投入,而是就客户有明确需求的技术进行研发,但当半导体技术逼近物理极限时,结构、材料、异质整合的研发挑战更为关键,在臺湾人才短缺的情况下,或可思考把一些与量产技术研发不那么直接相关,但未来会有影响的科研技术项目摆在美国,运用美国顶尖的科研人才来掌握技术生命曲线更前期的技术领域,并承诺美国政府研发中心的50%会由臺湾派遣。如此一来,对臺积电来说,投资金额远较设立晶圆厂为低,而臺湾派遣人才可透过与美国人才共事掌握更前端技术,而对美国政府来说,臺积电在美国的价值活动从制造延伸至研发,且从臺湾引入对等的顶尖人才,则是臺积电更进一步融入美国的政绩,可有效化解美国的忧虑与误解。当臺积电处于如今最顶尖的产业地位与关键战略核心,再怎么低调都无法从地缘政治风险中脱身,适度的舍才有可能换来更长远的长治久安!
德国观察(2):以光学技术为核心 蔡司转型数据与整合服务供应商
蔡司(Zeiss)集团总裁佩澈(Andreas Pecher)问我,DIGITIMES如何观察蔡司?我说,可以慢慢从研发导向走向应用市场,在量测与检测两种应用技术之间做出适当的平衡,在臺商与中国厂商之间找到差异化的服务模式,而行销也必须从过去单纯寻找代理商,走到深度经营市场的路线。量测侧重于研发,检测则是生产流程的关键,我在展览会现场听到很多机臺的主管都不厌其烦的说明「数据」的重要性,显然蔡司意图串连数据,打造成「以光学技术为基础的数据与整合服务公司」,以迎接人工智能与全面性大数据时代。蔡司是光学事业的泰山北斗,但过去是以顶尖技术不断的超越极限,为光电的结合带来非凡的贡献。在5納米、3納米等高效运算(HPC)芯片制程上创造出极大的价值,与ASML合作的EUV设备,就是长期的研发与技术布局的突破。但现在我们不仅看到AI服務器与Google、Tesla、AWS,甚至微软(Microsoft)、ARM都在发展自研芯片,未来的边缘运算,从CPU、GPU延伸到各种NPU的商机,将会带领电子产业走向应用驱动的新时代。对蔡司而言,必须从以往Top-down的研发导向,也调整为研发+制造应用的双轨格局。以广达、纬创、富士康,及臺商在美中贸易大战之后,大规模回流臺湾所带来的智能制造商机为例,提醒蔡司对于经营亚洲B2B的市场应该有与欧美世界不同的做法。谁是蔡司光学设备的买主?我在现场询问蔡司自动化设备在大中华区的销售状况,这两年中国知名大厂可能采购略微超过一半的自动化生产设备,臺商约有4成,其余的1成多可能来自其他零碎的市场采购。从市场比重中,我们可以理解中国市场对蔡司的重要性,但蔡司也面对过于仰赖中国生产体系的风险,特别是电动车市场,正因为西方国家采取制衡、加征关税的措施,2023年年产辆已经接近1,000万辆电动车的中国,正面对新的挑战。中国运用多余的产能出口,必然对欧洲车厂带来严重的后果,最近大眾汽车(Volkswagen)将关闭三个德国工厂,并减薪10%,裁员数万人的消息让德国人十分震撼。大眾汽车在中国一年出厂超过300万辆,为了维持在中国的市占率,不是裁撤中国的工厂,反倒必须面对本土工厂裁撤的压力,这件事必然对中德产业关系带来长远的影响。从全球的观点回推企业战略时,我们可以归纳出「全球化时代飘然远去」,德国、日本、印度、墨西哥这些还有机会角逐生产优势的国家,都会试著整合区域内的关键力量,拥有光学关键技术的蔡司,不会被遗忘于巴符州的小山村里。
德国观察(1):顶级市场,谁是赢家?
我到过德国六次,其中五次是因为到汉诺威CeBIT参展或讲课,德国经验只局限机场与展场之间。此行是受邀到硅谷为华美半导体协会(CASPA)与臺湾硅谷产业科技协会(TAITA)的年会演讲,顺道拜访硅谷的重点公司,然后从旧金山飞柏林参加蔡司(Zeiss)的创新高峰会(Quality Innovation Summit),并以「Reshaping Global ICT Supply Chain」为题,做一小时的报告。无论美国、德国公司,他们共同的议题都是「半导体与AI服務器」,也都关心臺湾在美中贸易大战中的角色与可能的发展,而我沿著蔡司这条线,汇整出我所理解的欧洲企业。这次在臺湾蔡司总经理章平达(PT Cheong)的安排之下,在演讲之前与集团总裁佩澈(Andreas Pecher)、IQS部门总裁瓦维拉(Marc Wawerla)等三位决策高层见面。总裁佩澈甚至帮我联系了主导半导体EUV光学设备的技术长史坦乐(Thomas Stammler),让我亲访超级微影机的生产基地,也让我有机会深入探索德国工艺最顶级的殿堂。双轨发展,深耕核心客户蔡司调整参加大型展会的经费,拿来举办深耕核心客户的「Zeiss-Quality Innovation Summit」。蔡司高层深信,产业景气在地缘政治的作用下存在很多變量,开拓新市场之外,仍须与主力客户、代理商维持深度的信赖关系,蔡司的经营理念是敏感有效的双轨策略,而不只是维持上下游伙伴关系的线性思维。在柏林举办的高峰会是个将近2,000人参与的大型活动,除了几个不同轨道的演讲厅之外,蔡司包下整个展览场,展示在不同市场领域的应用范例。蔡司共有4.3万名员工,是年营收超过100亿欧元的公司。这家坚持技术研发,维持长期经营品质的不上市公司共分为四大部门,分别是专攻消费市场的视觉镜片(Vision)部门、半导体事业部(Semiconductor and SMT)、工控事业部(Industrial Quality Solutions)、医疗事业部(Medical)。四大部门中,视觉部门规模最小,但却是市场上最熟悉的蔡司品牌。许多人不知道,蔡司除了在眼镜视觉市场上称霸全球,也是ASML在光学技术上最重要的战略伙伴,而工业控制与医疗设备也是世界翘楚,光是使用蔡司设备进行眼球微创手术的案例已经超过1,000万人了。做为一个涵盖全球市场的大公司,对于地缘政治、分散型生产体系的形成非常敏感。现在蔡司正在重塑对于亚洲产业与市场的经营策略,也正在摸索东亚电子产业生产体系,未来与蔡司之间的连结模式。2024~2025年在美国大选、中国经济备受压力的现实下,全球的工业国家都在面对资源重新配置的压力,我们知道全球化的时代飘然远去,如何重新找到定位,这已经不是纸上谈兵的议题,而是现实上必须面对的企业生存关键。对于蔡司这种等级的制造厂,甚至是已经在全球供应链上活跃的厂商,都应该以建构全球价值,创造工作机会为理念,否则掠夺型企业横行的同时,我们所坚持的ESG、公平正义还有意义吗?不管是参与大型展会,或自行举办产品说明会都是与社会沟通的环节,这些都不该只是将本求利的算计,知识与经营利益的分享、共创、共有,才是企业经营的真正价值。
让MusicTalk诉说敲击的故事
2024年10月6日,我到国家戏剧院观赏朱宗庆打击乐团击乐剧场《六部曲》。打击音乐水准极高,让观众感受到洗涤心灵的音乐飨宴。国家戏剧院是一座智能剧院,舞臺背后设有巨型银幕,能与表演者进行虚实结合的互动。表演过程中,银幕上出现浮云、瀑布、抽象光影等动画。感觉上打击乐器与银幕图像较无實時地关联。在我脑海中浮现的是各种打击乐器的實時梅尔频谱图 (mel spectrogram)。梅尔频谱图是一种变形的频谱图,常运用于语音处理和机器学习。它与频谱图类似,显示音频信号随时间变化的频率内容,但其频率轴不同。我发展一套AI工具MusicTalk,其中一个功能可以實時分辨出一首乐曲中同时演奏的乐器种类。MusicTalk将乐器的声音转换为梅尔频谱,并以特殊AI演算法分析,准确度接近95%,是迄今最准确的方法。我在开发MusicTalk时,研究许多打击乐器的梅尔频谱图,因此在《六部曲》的演奏过程中,各种变化多端的梅尔频谱图不断在我脑海中浮现。将抽象动画与敲击声音连结并不容易,若能将敲击声音与科学结合,将更具意义。第一位以科学系统化赋予敲击声意义的是奥恩布鲁格(Leopold Auenbrugger, 1722~1809)。他是旅馆老板的儿子,在维也纳大学接受医学教育,深受Gerard van Swieten影响。1761年,他出版小书《新发明》(Inventum novum),成为以叩诊法(percussion in the diagnosis)诊断胸部疾病的第一人。尽管传说他的发现灵感来自童年敲打父亲酒桶的经历,但更可能的是他敏锐的音乐耳朵让他能分辨出胸部病变过程中的音调变化。他描述各种病变如何导致叩诊时音调转变为不同音色,如「高音」(sonus altior 或鼓音)、「低音」(sonus obscurior 或模糊音)、或「钝音」(sonus carnis percussae 或肉叩音)。这些发现后来得到临床诊断的实证。奥恩布鲁格一生酷爱音乐,经常在家中举行午后音乐聚会,莫札特 (Wolfgang Amadeus Mozart, 1756~1791) 一家也曾受邀参加。他的2个女儿都很会弹钢琴,宾客们曾评论说:「她们两人,尤其是姐姐,弹得非常好,并且极具音乐天赋。」10年后,莫札特为萨尔茨堡(Salzburg)创作一些新歌剧,其中之一是日耳曼喜剧《烟囱清洁工》(Der Rauchfangkehrer)。该剧于1781年首次在维也纳国家歌剧院上演,剧本正是由奥恩布鲁格撰写。奥恩布鲁格的音乐艺术天分无庸置疑,能以极具创意的方式将器具的敲击声赋予科学 (医学) 的意义。奥恩布鲁格的成就,影响我对利用敲击工具(乐器)解释科学现象的兴趣。我开发出 AI 工具 WatermelonTalk,能将拍打西瓜的声音分为4类,代表不同的成熟度,准确度高达94%,是迄今最精准的成熟度判定方法。在聆听《六部曲》时,我期望编剧者能充分利用如MusicTalk这类AI工具,以科学方式利用未来剧院的智能银幕,呈现敲击乐器的特征,使观众更能理解乐器所表达的内涵,进一步促进音乐与科技的深度结合。
光子计算发展的新契机
如果光子可以如电子般的携带信息,自然它可以同时应用于通讯和计算。 光子最早应用于線上通讯,譬如过去互聯網应用中以光纤替代电话线,自然是以光子替代电子来携带信息。 最近光子通讯再被提上台面是因为AI服務器。未来大部分通讯会发生在芯片与芯片之间、服務器与服務器之间,巨量的信息传输是目前信息的处理、传输中最损耗能量的部分。 但是现在服務器芯片的设计于传统PPA(Performance、Power、Area)的考量中倾向对于效能的追求,低功耗与散热的需求在设计阶段就顾不上了,只好在制程与先进封装中讲究。这是矽光子被排到半导体时程上的最大动力。 光子能用于通讯,能否用于计算呢?在1960、70年代发明雷射、类比信號处理时,光子计算(photonic computing)的概念就启动了,80年代开始研发光子元件。90年代要走向应用、量产时,为时已晚。90年代初的先进制程大慨在0.5~0.8微米之间,但是光子元件的尺度大多在微米以上,在晶圆上难以制作出功能可以与电子元件匹敌的产品。之后,就愈差愈远了。 光子计算再度被认真考虑也是因为AI的兴起。AI的计算,不管是卷积神经網絡(Convolutional Neural Network;CNN)或者是在大型语言模型中使用的变换器(transformer)模型,其最底层的计算都是矩阵乘法的平行运算。數據量大,但是演算法相对单一,这是光子计算的良好应用场域。 2016年沈亦晨(Yichen Shen)及其研究伙伴提出用光子计算来处理深度学习的想法。 光子元件种类繁多,在此应用被选中当成类似半导体线路基础元件晶體管的是马赫-曾德干涉仪(Mach-Zender Interferometer;MZI)。 MZI是矽光子的基础元件,常用来调制(modulate)光的相位(phase)。当光进入MZI后,首先经过分光器(splitter),光被分离成2束而在个别的光路(optical path)上前进。在其中一条光路上光不再受任何作用;另一条光路上,有一个可控的电压可以施加在光路的构成物质,改变物质的折射率(refractive index),进而改变在此光路上光的相位。最后2条光路上的光再合并(recombine),二者会相互干涉。如果其中有一光路受到相调控,2束光会形成破坏性干涉(destructive interference),而在2个光路出口所测得的光强度(intensity)会有所不同。这就是MZI可以如晶體管用于计算的原理。 MZI就是光集成電路(Photonics Integrated Circuit;PIC)的基础单元,利用MZI可以组成光集成電路来计算矩阵相乘,这就是光子计算于AI的应用场域。 光子计算可以利用薛汀格微梳(Schrodinger microcomb)大幅提高计算效能。薛汀格微梳是用连续波(continuous wave)雷射光源分离为在频率空间等间距的多重光源,可以用于平行计算。一个微梳可以产生数十乃至于数百个频率的光线,用于平行计算。在某种程度上,薛汀格微梳大幅的弥补一般光元件尺度较大的缺陷。 2016年光子计算方案提出时,矽光子的技术离成熟还很远。在过去「异质整合蓝图」(Heterogeneous Integration Roadmap;HIR)进程中,2020年矽光子才会上场,实际上矽光子的量产时程远迟于此。 最近提议的用钽酸锂(LiTaO3)来做矽光子元件,进一步提高用MZI来做光子计算的可行性。 钽酸锂在5G時代已开始使用,是与半导体制程兼容的材料。它的制作成本低,且有几个物理特性适合MZI的制作。1. 低双折射性(low birefringence),线路设计简单,可以提高光元件密度;2. 低光学损耗(low photon loss),传导信号容易维持;3. 可以制作高效能MZI。用它做的MZI可达40 GHz的电光帶寬(electro-optical bandwidth),并且拥有1.9V•cm的半波电压长度积(half wavelength voltage length product,这数字代表使光相位反转180°所需的电压乘以长度,愈小愈容易调制相位)。 光子计算理论上速度快、功耗低,是现在计算面临各种物理壁障的可能出路之一。过去因为矽光子的技术未臻成熟,光元件的尺吋远大于微电子元件的尺吋,所以光子计算一直未能浮上台面。现在藉著AI服務器的兴起驱动矽光子技术的发展,获得额外的产业推动助力,搭乘顺风车。应用上选择与AI高度相关的ASIC类型的计算,再看能否有个起始的立足点。
智能应用 影音