Vicor推出垂直供电设计 克服AI芯片大电流困境
AI在各类型产业的应用渐深渐广,随着智能化功能的强化,AI芯片所需的电源功耗也同步提升,不过电源大厂Vicor应用工程师杨有承指出,过去业界常用的电源技术,已难因应先进AI芯片庞大的电源需求,因此他在「Power Behind AI」演讲中,就介绍了AI芯片新时代电源设计与其优势。
杨有承表示,近几年AI功能不断提升,数据中心的电源使用量也越来越高,在环境保护与企业节能两大动力下,机房节能成为必要作为。根据Google的报告,过去该公司在全球机房的PUE(电力使用效率)为1.3,意即机房中的非IT电力耗损高达30%,之后该公司积极优化,2020年的PUE已降到1.1,成效相当明显。
从Google案例可以看出,数据中心市场对AI芯片电力的庞大需求。而Vicor内部的研究数据也指出,2015年AI芯片的TDC(热设计电流)仍仅约450A,峰值电流为500A;到了2021年,TDC已达1,000A,峰值电流更直达2,000A;随着AI芯片效能的高速成长,这两个数值的电流在2024年,有可能分别超过1,500A与3,000A。
除了AI芯片外,系统其他地方的电力损耗也是目前亟需解决的问题。现在机房内的网通切换器电流也高达1,000A,这部分产生的损耗也相当惊人,因此杨有承指出,现在业者要面对的是AI芯片与主机板两者加起来的电量耗损,另外还要加上高电量带来的散热问题。
杨有承进一步表示,以现有的AI芯片与主机板的结构方式运作,功率损耗高达50%,到了未来的1,000A需求时,会产生500W的损耗。对此问题,目前主流作法是增加铜箔layers,但此方式有其极限,小电流仍可接受,大电流则无法满足市场需求。为此Vicor也提出各种解决方式,像是将电源模块设计在主机板上或处理器封装的两侧,这种方式虽然可以大幅降低PDN(电源分布网络)的损耗、强化板端效率,满足现有市场上的电源需求,但仍有其先天限制,最大电流数仅能有650A,无法达到1,000A。
为了解决电源损耗问题,Vicor研发出新作法,将电源模块设计在处理器下方,这种直接供电的方式,解决了PDN损耗问题,经过Vicos的层层测试,TDC可达1,000A,且损耗仅有10W,与过去动辄数百瓦相比,成效相当明显。
除了提升效率、降低损耗之外,此作法的另一好处是释出处理器两端的空间,让设计者有更多弹性。杨有承指出,在高端Switching为了达到光与ASIC芯片达到最高性能,业者开始将光纤模块(OM)设置于处理器四周(Co-Packaged Optics;CPO),在此趋势下,如果仍采过去将电源模块置于主机板上方的方式,电源模块离处理器的距离将更远,PDN损耗也会更高。
除了透过垂直供电设计,提供AI芯片足量电流外,Vicor也提出先进散热设计。现在处理器的散热多为气冷,Vicor则与3M合作,推出浸泡式液体冷却方案,可有效降低AI芯片的散热问题。杨有承表示,未来Vicor将持续提出更多先进电源解决方案,协助客户顺利打造高效能AI芯片。