臺湾ICT产业的AI生态系
2010年前后开始真正受到瞩目的深度学习(Deep Learning),是人工智能(AI)相关技术进化的关键期,透过机器学习得到的经验,让AI技术有了新的依靠。2016年的AlphaGo更是推波助澜的重要突破,之后各种边缘装置(Edge Devices)出现在市场上,相关技术与半导体芯片的进展也受到瞩目。至于在半导体领域发展的特用AI芯片,则是一种特化型IC(ASIC),又可分为服務器与边缘端专用。目前大家关注GPU与CPU带来的运算之争,将来重心也会慢慢移转到前端设备,这些都是重要的变化、挑战,也是机会,而臺商是海景第一排的有力角逐者。AI半导体是指可以让AI軟件与演算法可以更有效率执行的各种专用芯片。现有的泛用CPU,在处理大量数据时可能面对极限,也让出更多机会给不同的微处理器,例如GPU、DPU与用于推论的NPU,特别是当初用来处理图像的GPU,运用在AI上,竟有远超过原来期待的功能。特别是NVIDIA结合CUDA的軟件设计程序,造就了NVIDIA今天的盛况。除此之外,其他如现场可程序化逻辑闸阵列(FPGA)芯片也出现了新的契机。GPU与FPGA也都是泛用型IC,非只为某一客户量身定制的ASIC。ASIC是具有明确目标功能的系统半导体,目前最被看好的GPU结合了CUDA軟件,在市场上具有压倒性优势,而NVIDIA的财报也证明过去的投资与软硬整合的优势正在发酵中。A100拥有6,912个CUDA Core与40GB HBM2存儲器,这套解决方案可以整合成一套超级电脑。2022年3月,NVIDIA推出效能比A100还要强大的H100。根据IDC调查,全球AI數據中心的市场规模,将从2021年的156亿美元,成长到2025年的318亿美元,年均成长19.5%,远高于传统服務器市场的10.7%。至于AI芯片市场,各大顾问公司也有许多评估,多数看好未来几年的成长,其中Gartner认为,AI芯片在2025年时可达700亿美元,到2030年AI芯片市场总值将达1,179亿美元,贡献整个ASIC市场的31%。由于看好AI芯片商机,从超微(AMD)、英特尔(Intel)这些NVIDIA传统的竞争对手,到上游的ARM、新思(Synopsys),以至高通(Qualcomm)、博通(Broadcom)每一家公司都虎视眈眈,英特尔甚至透过购并Habana,希望加速软硬整合的实力。除此之外,美国、英国、法国都有很多新创公司尝试开发出各种用途的AI芯片,中国当然也没闲著。百度、华为、阿里巴巴、比特大陆等,都有明确规格与定义的AI芯片发展計劃。此外,韓國存儲器双雄在存儲器内运算(PIM)市场上著力更多。三星电子(Samsung Electronics)在2020年发表HBM-PIM的产品,让芯片可以在没有连结數據中心的情况下,独立进行演算,对声音、影像在装置前端的应用上深具意义。走在市场最前端的晶圆代工业、设计服务业者,大致可以维持应有的地位,但最受挑战的是臺湾IC设计产业。在晶圆制造领域,14納米以下先进制程成为必要条件,拥有最先进制程的公司,仍将是市场上的宠儿。臺湾IC设计业虽只占全球市场的18%,在前十大业者中有3家来自臺湾,但臺湾擅长替代型商机,而非定义市场,参与前端市场的角逐。其次,业者面对人才短缺、成本激增、中国业者追击等相关议题,真正有实力角逐顶级商机的厂商屈指可数。臺湾的IC设计业者正积极赶上这一波大AI潮的滚滚商机。最后,前端设备的多元需求,AIoT商机无可限量。IBM估计,物联网终端设备总量从2020年的150亿臺,增加到2025年的1,500亿臺。10倍速成长加上多元商机,如何发展通用效益,又可以差异化设计的发展机制,是臺湾业者最大的挑战。
是谁搅和AI一池春水?
为角逐未来AI商机,各大厂商也拉帮结派,NVIDIA购并了Mellanox与Excelero,而看似被NVIDIA拉开差距的超微(AMD),也购并赛灵思(Xilinx)及Pensando。迈威尔(Marvell)、博通(Broadcom)、英特尔(Intel)也都各有盘算,特别是英特尔在晶圆代工久攻不下,CPU/GPU/DPU市场又面对严厉的挑战,除了发展类似CUDA的程序语言之外,也与Habana Labs合作,我们看到大厂决战光明顶的景象,也知道AI竞争现在才进入火热的阶段。继GPT-3.5之后,Open AI再度于2023年3月发表GPT-4,这套Foundation model更贴近市场的需求。短短几个月之内,上亿人的使用经验成为「学习」的基础,运算法的改善,也让AI应用带来新的境界。科技大腕相继加码研发,整个生态系的改善非常具体,微软(Microsoft)的积极态度也带来推波助澜的效果。到2022年4月底止,Office 365已经有3.2亿使用者,而搭配Office 365推出的Copilot軟件,让这些使用者有条件从过去经验中推演相关的应用。以Copilot的使用者做测试,每个使用者节省的时间大约是50%,这是个很庞大的数字与价值。Microsoft 365 Copilot可以连结Word、PowerPoint、Outlook、Teams等档案,并与Microsoft Graph、LLM等功能同步使用,也使用Grounding的演算法。微软在2022年底推出ChatGPT之后的两个月,推出ChatGPT Premium的方案,每个月收取20美元的费用,应答问题的速度可以快3倍。透过各种搭载的方式,让原先的Windows/Office等軟件得到升级的机会,这对微软而言,是十年难得一遇的好机会。微软查找引擎Bing市占率仅有2~4%,远远不如Google,但在这次改变的过程中,可能会是最大赢家,在推出GPT-4之后,Bing市占率提高到9%以上,2023年3月9日,Bing使用者首度超过1亿人。尽管Google的每日活跃用户数(DAU)已经超过10亿人,但我们看到微软在AI领域上的突破,可能给微软在数据检索上一个弯道超车的机会。未来大型數據中心将继续升级,借以进行加速运算,可以预期服務器与相关芯片、服务业者的商机生气蓬勃。过去每次的技术创新,都带来庞大的衍生商机。从工业革命的蒸气机到铁路,从互聯網的出现到各种游戏、生活体验不断革新,但这次的AI革命可能更胜以往。我们可以预期类似YouTube、SNS等新型态的服务平臺一定会出现,对臺湾的启示就是「軟件应用」必须积极参与、学习,而硬件制造当仁不让,特别是芯片与相关服务业者的价值体现,将会有新的面貌。
AI商机有多大?谁是获利者?
一旦Open AI建立完整的生态系,就可以主导整个商机,影响力越大的品牌与解决方案,将会成为市场上的领导者。微软(Microsoft)刻意造成「生成式AI等于Open AI」印象,加上Office 365的优势条件,微软可能是很大的受益者。由于需要强大的数据运算能力,在數據中心芯片市占遥遥领先的NVIDIA成为最大的获利者,臺积电也因为是代工伙伴而受惠。现在NVIDIA跟英特尔(Intel)叫板,甚至畅言「CPU时代已经结束」!导入AI不外乎是为了使用者忠诚度、提高效率,提升竞争力等。估计Open AI的市场规模,将从2023年的2亿美元,增加到2024年的10亿美元。游戏开发商可以利用各种AI工具加速产品的开发,并以各种内容的整合开发出新的商机与市场区隔。市场刚刚起飞,但速度也可能像ChatGPT一样迅雷不及掩耳!相较于现在的检索模式,对话式检索机制成本必然会增加,光是学习自然语言的运算机制,各种服務器、數據中心的投资就以1,000亿美元的规模来计算。Open AI需要导入1万颗以上的NVIDIA A100绘图芯片,相关资本支出与背后的维护都非常惊人。另据Semi Analysis估计,Google自主开发的Google TPU v4,资本支出高达200亿美元,这大约是Alphabet 2022全年资本支出的64%。可以预期「超巨量型數據中心」(Hyperscale Data Center)将是军火竞赛的一环,起步较早的微软与AWS都是领先者。但无论是内部或外部的连结,都是數據中心管理者很大的挑战。我们同时可以见到传输速度不断的提升,到2025年时,使用800G数据传输速度的Switch将高达2,500万个,这与2022年还是主流的100G相比,已经不可以道里计!整体而言,數據中心的演化,从最早的储存數據进化到演算,现在则是分散处理,借以取得最佳化的成果。为了有效管理这样的需求,除了过去倚重的CPU之外,现在數據中心更关注DPU(Data Processing Unit)的进展。这些可以有效管理储存数据的微处理器,将是下一波需求的主流。相较于过去专注在特定功能的微处理器,DPU更重视整合性的功能。简单来说,CPU用于一般的运算功能,GPU是加速运算功能,而DPU是专注數據处理功能。「Scaling AI Compute」是从數據中心的运算,延伸到网通过程,以及边缘端的多元AI运算机制。基于提高运算效能、降低功耗等多方面的考虑,大家把希望寄托在晶圆制造与EDA工具的进化。如何以ASIC半导体芯片为基础,生产出可以符合差异化需求的硬件设备,也都是制造厂非常大的考验。
竞争优势加持 抗逆风的2023年半导体列强群像
近期人工智能(AI)话题掀起热潮,不过2023年全球半导体市场仍难脱衰退,主要受到存儲器市场恐将年减30%以上所拖累。非存儲器部分,几家大厂包括英特尔(Intel)、超微(AMD)、高通(Qualcomm)、联发科第1季营收均呈衰退。至于晶圆代工龙头臺积电,受到全球众多IC设计公司、IDM业者所依重,但前4月累计营收亦较2022年同期减少1.1%,不如2022年时英勇。观察2022年全球前廿大半导体业者,在2023年的年度营收仍有机会较2022年成长者,估计只有博通(Broadcom)、NVIDIA、意法半导体(STM)、英飞凌(Infineon)、Microchip等5家。其中,前两者与數據中心有线網絡芯片及AI芯片相关,后两者则主要与车用半导体、工业用半导体有关。博通的半导体事业主要在有线通讯,特别是數據中心用網絡通讯半导体,因此较不受一般消费应用如智能手機需求衰退等因素的影响。另外,博通的定制化芯片在云端服务业者也占有一席之地,如Google的云端芯片TPU即采用博通的设计方案。随著主要云端服务及互聯網业者如亚马逊(Amazon)AWS、微软(Microsoft)及Meta纷纷以自研芯片提升服务效率及降低成本,博通及对应的晶圆代工业者臺积电均能受惠。2022年前廿大半导体业者中,NVIDIA的2023年营收成长率预期将是最亮丽者。主要原因是2022年第4季以后,生成式人工智能(generative AI)应用如火如荼地发展,在训练模型方面,算力需求快速增加,其A100/H100在服務器用GPU市场备受瞩目,A100 GPU单价已高于一般的服務器,H100 GPU更是A100 GPU的数倍。观察前廿大半导体业者对第2季自家营收展望,NVIDIA在营收季增幅度及年增幅度均明显领先。必须一提的是,NVIDIA纯粹半导体营收估计仅占整体营收的6~7成上下,高单价的服務器系统(如DGX A100、DGX H100)、軟件解决方案的销售金额占比持续提升中。NVIDIA未来加速转向AI生态系解决方案业者,不能单纯以半导体公司看待。尽管车用半导体缺货吃紧问题逐渐缓解,但对于优质产品供应商而言影响相对小,预期2023年全球车用半导体市场仍可创造近10%年增率,相对地,2023年整体半导体市场(包含存儲器)则恐年减8~10%。2022年英飞凌为第一大车用半导体业者,也是第三大工业用半导体业者。由于车用半导体及工业用半导体供应关系不轻易更换,在信赖度及品质上领导大厂仍占竞争优势。2023年英飞凌随著该公司车用半导体新产能的进入量产,加上在第三类半导体碳化矽(SiC)的发展也有所成,在电动车、低碳化、高能源效率化三大趋势下,英飞凌仍然处于顺风的态势,预计营收年增率有望突破10%,在前20大半导体业者营收年增率上有机会排第二名。意法半导体在2022年的车用半导体市场占有率居第三大、工业用半导体市场占有率为第四大,而车用及工业应用市场也是2022~2025年成长率较强劲的2个主要市场,优于通讯及消费性电子应用表现。意法的新建半导体产能在2023年以后陆续投产,可纾解过去该公司在市场上的供给不足。意法核心竞争力之一,乃掌握许多专属制程,先进制程则委托臺积电等业者代工。Microchip在2022会计年度营收的75%在工业用、數據中心与运算、车用,因此在2023年受到消费性电子及手机市场衰退的影响也较小,该公司与客户签有长期供应合约,且在微控制器(MCU)市场有其地位,不易受景气起伏冲击。总体而言,半导体市场虽然起起伏伏,但长期需求仍是向上,上述5家业者掌握云端服务/數據中心、AI、电动车及ADAS、工业应用高效率化的大趋势,能在半导体市场衰退年仍然逆势成长,有其核心竞争优势所在。本文探讨仅限前廿大业者,若把眼光扩大至半导体供应链,美系EDA两大龙头业者近10年来营收未曾衰退,2023年也将持续成长,也是值得关注。
人工智能的启示
图灵奖(Turing Award)得主Geoffrey Hinton在日前公开讨论人工智能(AI)的风险。AI「往往会从分析大量数据中学到意想不到的行为」。这并非意味著具有自主意识的AI会摧毁人类,而是我们无法预测AI的行为,特别是当个人和企业允许AI系统不仅生成其自身的代码,而且在自己的计算机上运行这些程序时,Hinton担心「有一天,真正的自主武器将那些杀手机器人变成现实」。第一个实际的AI系统是由Edward Feigenbaum及Raj Reddy实现,称为「专家系统」,是一种智能的电脑程序,能运用知识与推论来解决只有专家才能解决的复杂问题;他们也因此一贡献荣获1994年的图灵奖。然而,许多系统需要模拟的参数甚多,至今仍然无解。可见计算机模拟的应用博大精深,即使今日AI技术突飞猛进,有许多题目仍值得深入研究。图灵(Alan Turing,1912~1954)在1950年发表一篇重要论文〈计算机与智能〉"Computing Machinery and Intelligence",首次谈论到AI,并提出图灵测试(Turing test),为信息领域创建智能设计的标竿。图灵测试指的是,如果一臺计算机能够欺骗人类, 相信它是人类,那么它就应该称为智能计算机。AI缘起于模拟人类行为,自然也常用于社会学。密歇根大学的政治学教授Robert Axelrod,在1980年代进行一连串电脑模拟实验,找一群专家写出不同电脑程序,模拟人类行为,让这些程序互动、合纵连横,看哪个程序最后会胜出。这些程序有些模拟「金律」,有些模拟「银律」,有些则模拟「铁律」。所谓「金律」(Golden Rule),语出《新约》7:12「无论何事、你们愿意人怎样待你们、你们也要怎样待人」;「银律」(Silver Rule),语出《旧约》21:24「以眼还眼,以牙还牙,以手还手,以脚还脚」;「铁律」就是「己所不欲,先施于人」,外在表现是「先下手为强,后下手遭殃」。结果最成功的是模拟「银律」的Tit-for-Tat程序。这个程序一开始采取合作,若对方也肯合作,接下来则仍采合作策略;若对方吃你豆腐,下一步你就占回便宜。在实验中,实施金律的程序一败涂地,尸骨无存,可见咱们先总统蒋公介石对日本「以德报怨」的做法是行不通的;实施铁律策略的程序一开始也有不错的表现,但长期下来,所有被它吃豆腐的人不是死了,就是躲它远远的,它最后也没戏唱。有一个铁律例子,就是石油大王John Rockefeller(1839~1937)。他专耍先下手为强的手段,整垮所有对手,成为最有钱的人。但他的手段未免太狠,大伙都不敢恭维。Rockefeller也知道自己以前做事实在不上道,因此在退休后的余生,致力于慈善事业补过。然而,他过去的作为仍然祸贻子孙,他的后人能力再强,条件再好,想选总统,至今都选不上。延伸报导从Google查找趋势看三大AI技术浪潮
米德教授奇人奇事
在Chris Miller所著《芯片战争》(CHIP WAR: The Fight for the World’s Most Critical Technology)一书中,多次提到Gordon Moore(1929~2023)与加州理工学院(California Institute of Technology)米德教授(Carver Mead)的互动。在1965年,当Moore还在快捷半导体(Fairchild),手绘出从1959~1965年每一矽芯片中晶體管成长数字,总计只有5点数据,并预测未来成长会依照每1.5~2年以1倍的速度增加。Mead教授当时是快捷半导体的顾问,随即将此称之为「摩尔定律」(Moore's Law)。Mead曾回忆,当时他正在研究半导体内电子的量子穿隧效应(tunneling effect),在此事后没多久Moore就问他,穿隧效应要在很小的尺度才会发生,那晶體管可以做到多小的尺吋?Mead花了些功夫答复此问题。1968年,Mead提出晶體管尺吋微缩理论(scaling),也就是在MOS晶體管的闸极长度微缩同时,每一晶體管所需耗用的功率是与长度成平方的下降,同时晶體管速度却等比例增加—即晶體管效能是随著晶體管闸极长度微缩,而呈现3次方的改善。当Mead在学术会议上,报告MOS微缩理论时,并预测未来1个芯片上可以有上亿个晶體管存在,并没有多少人相信Mead的理论。当时认为在这么小的尺吋下,光是所产生的热即足以烧毁整个晶體管。事实证明Mead是对的,Moore's Law横跨超过50年时间,最主要的基石在于尺吋的微缩,而Mead的理论提供Moore's Law的理论基础。Mead在1970年代初期,即洞悉未来芯片上可以制作出众多的晶體管,代表将拥有庞大的算力,其也因此建议英特尔(Intel)高层,发展电脑所需的芯片。不过,如何有自动化的IC设计工具,处理日益复杂的电路设计,成为一个关键议题,Mead的研究随即转向IC设计。Mead于1970年在加州理工学院开设VLSI课程,在课堂上并将学生所设计的各式IC,用统一的光罩,手刻出布局图,最后完成硅片的制作。这比国内芯片设计中心对学术界的服务,整整早了20年。Mead与Lynn Conway于1979年合著的Introduction to VLSI System,更是IC设计者手中的圣经。Mead在1970年代初期,即投入Si compiler的研究,这是电路模拟及布局图自动化的滥觞,造就现在EDA工具的产业。Mead更于1979年提出未来半导体产业,会由多数的IC设计公司(fabless),及较少数目的晶圆厂(foundry)所组成。这与同时期张忠谋先生,在德州仪器(TI)内部所提出foundry概念,不谋而合。笔者在美国求学时,即久仰Mead大名。因为笔者的研究题目是化合物半导体的微波高速元件及集成電路,第一个发明出此类元件(1965年出现的GaAs MESFET)的正是Mead。化合物半导体很难成长出优质的氧化层,不像硅片有高品质的二氧化矽,所以化合物半导体只能利用金属作为闸极,直接接触到半导体。此接触(junction)因为材料不同,衍生很多的界面缺陷,因此电子几乎无法在通道内(channel)运行。Mead很技巧地利用此接触所产生的空乏区(depletion),来控制电子数量,也由于电子远离界面,所以能够自由地运行。至今我们在无线通讯所使用的高频元件,其运作方式依旧是使用Mead的原创。Mead在2000年后,又回到基础物理研究,尤其是量子的电动力学及重力理论。Mead似乎可以在不同的学术领域,来去自如,悠游自得。Mead于2022年荣获日本的京都赏,奖金是5,000万日圆。京都赏是由京瓷(Kyocera)已故創始人,稻盛和夫于1984年所创立,奖励全球对于前瞻技术、基础科学及人文艺术等3个领域有杰出贡献人士。华裔科学家邓青云博士,发明有机发光二極管材料,于2019年获得京都赏;中国清华大学信息科学教授姚期智博士,也于2021年获此殊荣。Mead的学术研究,由基础的半导体元件,到IC compiler的原创,以至于VLSI设计,对于半导体相关的领域做出重大贡献,在学术界还无人能出其右。他的洞察力及远见,更激发整个半导体产业的发展,终究造福大众。
从韓國最新偶像男团Plave说起
前几天在韓國一个主要流行歌曲音源榜Bugs上,有个出道2个多月的男偶像团体Plave首次拿下音源排名的第一、二名。韓國有不计其数的男团竞相出道,相信多数读者跟我一样,记不得团名,分不清谁是谁,但Plave这团却没这个问题,因为他们是虚拟偶像。这个团体有5位成员,分别是诺亚、艺俊、班比、银虎、河玟,有著外貌、身高、岁数、队内角色担当等角色设定,最年长的成员诺亚也才22岁,除了个子最小成员班比为174厘米外,其余成员都在180厘米以上。这样一个新出道虚拟男团,如何打败众多真实偶像团体拿下Bugs音源榜榜首?先来看一下这几年韓國的虚拟偶像发展,如同我们在探讨元宇宙有虚拟实境(VR)、增实境(AR)、混合实境(MR)、延展实境(XR)等定义和分类,韓國在虚拟偶像的经营上,做了可与此相对照的多元尝试。一、实体偶像的虚拟分身:SM娱乐(SM Entertainment)的一线4人女团aespa在2023年5月刚推出的新专辑《My World》创下销售破200万张的佳绩,其自2020年出道时,每位成员都拥有元宇宙的虚拟分身ae,分别为ae-Karina、ae-Winter、ae-Giselle、ae-NingNing(出道曲Black Mamba MV),2022年还跨界到RPG手机游戏《第七史诗》,成为游戏副本主角。二、虚拟偶像团:包括2021年出道的ETERN!TY及2023年出道的MAVE:等,前者是个11人的女子大团,出道前幕后推手人工智能(AI)公司Pulse 9,还举办仿效韓國知名选秀节目的模式,推出101位AI女练习生供网友票选出前十一名出道。 (可见最新单曲DTDTGMGN MV )后者则是韓國影视娱乐业霸主之一的「Kakao娱乐」与游戏公司「Metaverse娱乐」合作推出的4人女团,出道单曲Pandora自2023年1月下旬发布以来,迄今在YouTube上已达2,320万次浏览纪录,按赞数高达40万次。(可见Pandora MV)三、虚实混合团:韓國第一个虚实混合团乃偶像男团Superkind,2022年推出第一位成员担任门面角色的虚拟人物Saejin,这5人团体的另4位成员都为真人,2023 年3 月发布最新单曲,又新增1真人1虚拟人,扩编成为7人团。 (可见Moody MV)四、真人+2次元外皮团:这种组团模式就是本文一开始所谈的Plave,幕后推手是韓國三大公营电视臺之一的MBC旗下公司VLAST。Plave是一个5人男团,外形乃是韓國直条網絡漫画风格的俊男,但在这「二次元漫画外皮」后却是有5位真人团员,以3D模塊+动态捕捉方式演出,于2023年3月12日推出首张专辑《ASTERUM》出道。(可见出道曲Wait for you初舞臺 )一般韓國偶像团体推出新的单曲或专辑时,会有数周密集宣传打歌期,冲刺流量与销量,过了这段时间后在排行榜上成绩就逐步往下,而像Plave这般单曲推出3个月后才「逆行」攀升至排行榜首位的情况极为罕见。我的观察是,其他的虚拟偶像的呈现都是预先设定好的演出,但Plave则因为虚拟偶像外皮后是5位能唱能跳的真人,透过舞蹈挑战、跆拳道示范等各种主题直播,可跟粉丝密切互动;由于是3D建模,在直播时常常出现团员间严重穿模(肢体间相互穿透叠加)或是肢体突然扭动至不可能角度的情况,团员间常常得自嘲或乱掰来因应补救,造成很多「爆笑梗」,也让愈来愈多人入坑变成粉丝。从1996~1997年第一代偶像团体H.O.T、水晶男孩与S.E.S发展迄今,韓國偶像团体市场版图早已涵盖全世界,防弹少年团与Blackpink更成为全球最顶尖的潮流偶像。在这片市场沃土上,不仅有如IVE与New Jeans等大势团体持续扩大声势,也有如本文提到导入新科技与新经营模式,探索虚拟偶像的各种可能。虽然元宇宙如今热度稍退,但生成式AI的出现对元宇宙内容的发展却是一大助力,拥有全球市场渗透力及已然尝试多元虚拟偶像经营模式探索的韓國,是否又将在元宇宙再创新一波韩流呢?Plave出道迄今初尝成功的经验,是否也在提醒我们,high tech也需要high touch呢?
人工智能的基础建设
各种机器学习模型的成本将因为半导体的运算能力而出现更好的价格诱因,一旦使用价格降低,使用者必然大幅增加。使用人工智能(AI)将成为公私领域日常工作的一环,商品化的结果,就真会是「AI的iPhone时刻」来临。一旦Open AI成为常态,各种生成式的应用都需要NVIDIA數據中心与专用芯片,业界的相关效益可想而知。与传统服務器不同,AI专用的服務器有80%是使用GPU,10%使用CPU,而一般數據中心的服務器,60~70%使用CPU的运算能力。以NVIDIA的DGX服務器建构组合为例,用8颗GPU、2颗CPU组成,GPT 3.5就需要1万颗A100芯片,而一般学习型的服務器只需要500~4,000颗的GPU。大家都把焦点放在臺积电,确实臺积电是仅次于NVIDIA的赢家,而且这一波大潮才刚刚开始而已。NVIDIA最早推出的A100,在Hooper 100推出后,仍然具有很大的吸引力,那为何NVIDIA可以一枝独秀呢?2013年以前,數據中心的投资规模一年大约550亿美元,但真正大幅成长是在2013年以后。2017~2022年间,數據中心的年均成长达到11.8%,而估计未来5年,NVIDIA规格的數據中心,就算只以维持目前的市占率估算,也可以有年均20%以上的成长率。乐观估计者,甚至认为年均可以达到40%以上。NVIDIA吃肉,臺厂喝汤也可以获利丰厚。现在臺厂只要跟绘图芯片有关的,生意都做不完,市场传言纬创、富士康、广达都接到大单,而黄仁勋在CPMPUTEX期间,去拜访微星、技嘉,也与联发科携手开创智能座舱的商机,服務器之外,电动车、车联网的商机还在等著!IDC指出,2023年AI与相关軟件的市场是5,192亿美元。Gartner则说,2020年时,AI占公司IT支出比重是7%,到2023年会增加到10.5%,而2026年是13.8%。这是以全球軟件市场当分母的推算,那么軟件商机背后的硬件世界呢?几年前黄仁勋曾说:「AI会吃掉軟件,軟件会吃掉硬件」的豪语。我认为黄仁勋的话说对了一大半,硬件是无可替代的,特别是芯片,最大赢家仍然是硬件制造业,而与服務器、數據中心相关的事业体,也会有庞大的商机。
世界演化速度比我们想像还快
ChatGPT以雷霆之势席卷全球,短短5天就累积达到100万名用户,相较于Facebook用了10个月、Netflix 41个月,ChatGPT与IG、Facebook、Spotify、Airbnb等前辈平臺相比,速成的效率令人咋舌。2016年AlphaGo的出现,确实吸引一波投入人工智能(AI)应用的热潮,AlphaGo打败世界棋王是整个AI应用的先声,但棋王的世界我们很难想像。如果ChatGPT是个成功的典范,那么关键原因就是ChatGPT走入了寻常百姓家,成为每个人都可以活用的工具,所创造的共营效益当然不可相提并论。也许很多人还在嘲弄人工智能是「人工+智能」,各种内容的品质仍有许多令人诟病之处,但从质与量两个不同的角度思考,「量」的成长似乎更为关键,也因此初期的效益显现在不需要深度思考的策略上。根据IDC估计,2022年全球的数据总量是97 zettabytes,估计2025年将倍增到180 zettabytes。只是臺湾的占比大约是1%,加上繁体中文的局限性,臺湾的AI产业要与本地接轨,得有非常不一样的想法与战略。有一段时间,我们还会说5G有很多闲置的空间,需要考虑6G吗?但就算芯片运算速度再快,无法将数据往外传输,这些新的基础模型,也都只是纸上谈兵而已。数据之间的流通,除了數據中心储存的大量數據与快速运算的能力之外,一方面也带来网通产品的新商机。云端的服务机制已经不是议题,而是必要的条件,串连公私领域的混合云更受瞩目。云端服务业者,正结合网通设备将传输速度从现在的100G提升到400G,甚至往800G迈进。这些重要的趋势,也可以从博通(Broadcom)的财报看出端倪。博通说2022年AI相关网通设备销售金额是2亿美元,估计2023年可以成长4倍,达到8亿美元的规模。这个金额不是什么了不起的成就,但很明确显示,这是云端与网通业者相关投资的领先指标。除了數據中心的运算与數據储存能力之外,边缘端的各种设备也都蓄势待发,我们现在清楚知道,数据世界里的变化是相互连动,也超过一般人能想像的范围,网通环境也是促成AI应用走向商业运转的重要推力。
是谁激起「人工智能」的千层浪?
人工智能(AI)早已被大家所熟知,但直到ChatGPT出现之前,大致还停留在暗潮汹涌的阶段。延续三年的疫情,半导体技术的大进化,促成了AI应用技术在2023年大爆发。耀眼的成绩让NVIDIA的股价大涨,市值1萬億美元的门槛让人望而生畏。罗马是一天造成的吗?答案当然不是!2005年前后,GPU的演算能力开始与CPU出现差异,部分功能甚至可以领先。由于CPU与GPU的设计架构不同,这是很自然的演化。NVIDIA为了这一天已经做了很多年的准备,CUDA(Compute Unified Device Architecture)这个軟件开发环境,让C语言程序使用GPU做图像处理外的运作工作,也让开发商更容易导入GPU,这也是NVIDIA领先的关键。一旦开发商都跟进,生态系自然就可以水到渠成,更多的數據中心采用NVIDIA的设计与GPU,间接也影响了臺系服務器与网通设备大厂的经营绩效。在2020年导入GPT- 3之前,AI领域的进展十分有限,对答的内容仍然无法因应商业的需求。但过去6年,NVIDIA的數據中心芯片演算速度提升了26倍,NVIDIACEO黄仁勋积极参与Open AI的技术合作計劃,透过长期的学习与使用经验,如今NVIDIA的GPU结合了軟件,成为超巨量AI模型中的遥遥领先者。NVIDIA的奇幻之旅能延续多久?周边生态系可以雨露均沾,还是赢家全拿?对臺湾而言,AI成功的经验意味著惊涛骇浪,还是如黄仁勋所说的:「这是人工智能的iPhone时代」,臺湾搭上这趟便车成为其中一个重要的赢家。产业界都说「赢家全拿」,想要分杯羹,需要什么条件呢?臺湾ICT产业有多少胜算,机会从何而来?对手是谁?黄仁勋1984年从大学毕业,迎接的是PC即将起飞的年代,而2023年是「AI起飞的年代」,期望毕业的学生可以掌握时代的契机,成为浪尖上的英雄。1984年底,我念完研究所,1985年迎接的也是PC元年!读完李开复的《人工智能来了》,李开复说需要复杂决策与推论的工作,短期内很难被取代,这就是我说DIGITIMES目前高枕无忧的背景。如果再考量,Google查找引擎所到之处,繁体中文仅占0.01%,这样的生成式语言模型未必能满足我们的需求。在B2C的市场,「繁体中文」是孤岛式的数据组合,但在B2B市场里,这可能是天然的保护伞,我们会做出什么样的选择呢?江山如画,一时多少英雄豪杰?他们都说这是「AI的时代」,但跟臺湾有什么关系?黄仁勋是「美国硅谷观点」,开创微软亚洲研究院的李开复是「北京观点」,不是不对,只是咱们自己得「想清楚,说明白」,找到属于臺湾的AI时代!
智能应用 影音