GB200卡关瓶颈主角换人 散热元件台厂新机会
NVIDIA的GB200何时出货,万众瞩目,被点名可能影响出货原因在于散热,然散热业者指出,原本被视为出货瓶颈的快接头(QCD)已不缺,反倒是冷却液分配装置(Cooling Distribution Unit;CDU)供货时间较长,此也带来台厂新机会。
市场传出,GB200机柜恐将延后1季到2025年第2季以后才会放量,然何谓「放量」,并无明确定义。广达、富士康等ODM厂都强调量产规划时间不变,却未明确说明量产有多少。
众说纷纭下,目前业界普遍共识是,2025年GB200出货强劲可期,且量会逐季拉升。
至于GB200卡关瓶颈?之前台积电的CoWoS封装状况已解,如今有人点名是散热元件问题,也有人提及,是连接器出现问题,亦传出是NVLink相关零件卡关。若以散热元件来说,相关业者指出,并非技术无法赶上,而是产能因素吃紧。
之前曾经传出,快接头缺货是瓶颈,然随着国际大厂量能拉升,且NVIDIA开始出面认证更多厂商,也解决供货吃紧问题,业界人士笑称,现在快接头满街都是,反而供货较吃紧的是CDU。
延伸报导专讲堂:AI基础建设:冷却技术
业界指出,CDU的供货时间约达4~6个月,甚至更久,主要因为其中的零组件,包括板式热交换器、马达、流量计供货时间都长,再加上组装测试,因此时间拉长。
另一说法是,2家国际CDU大厂:Vertiv、BOYD的上游供应商重叠,双方在抢产能,导致供货不足。
因应市场急迫需求,国内散热解决方案商元钛正在扩厂。元钛原本总部设在林口,将迁移至汐止,现有的林口将全部改为生产线,主要生产CDU与Sidecar,元钛董事长陈茂钦指出,规划在汐止另外设厂,预计2025年完工,为新产品预作准备。
元钛目前已经量产1,300 kW的CDU,新款的2,500 kW的CDU正在打样,将送到NVIDIA认证,预计2025年通过认证后量产。元钛总经理朱佳建指出,1,300 kW主要是因应NVL72需求,其单机柜的散热需求就达到120~130 kW。
元钛经营团队早在1997年就在美商爱美达(现在的BOYD)从事散热产业,尔后转战美商Vette倍亿淂科技,属于液冷散热老前辈。2022年创立元钛后,协助华硕、广达打造国家高速网络数据中心的水冷散热系统,2024年6月纬创宣布参与元钛现增。
陈茂钦表示,相对于美商,NVIDIA揭开的这场液冷散热比赛,对元钛很有利,他说,美国厂商都是老同事,然美厂开发速度没有台厂灵活,当大家都在抱怨NVIDIA迭代太快时,这反而是元钛的菜,因为台厂习惯速度快,相较同业,元钛leadtime更短。
朱佳建指出,这2年的主流会是sidecar,因为客户案场没有足够的冰水来源,除非重新建置管线,卡在机房无法停工,因此会用sidecar因应,目前都会是1柜NVL 72对2柜sidecar或2柜NVL 72对3柜sidecar设计。
朱佳建表示,现阶段频传GB200机柜过热,追根究底是芯片封装设计问题。因其封装接合导热效果不佳,芯片内温度偏高,只好提高冷却设备风量。现阶段GB200的机柜散热需求为120~130 kW,2025年推出的B300,甚至可能会直接跳到150 kW,水冷势在必行。
责任编辑:陈奭璁