GB200卡关瓶颈主角换人 散热元件台厂新机会 智能应用 影音
Microchip
DForum0115

GB200卡关瓶颈主角换人 散热元件台厂新机会

  • 李立达台北

AI服务器水冷散热商机,元钛董事长陈茂钦(中)、总经理朱佳建(右)、业务协理王毅光认为这是台厂的菜。李立达摄
AI服务器水冷散热商机,元钛董事长陈茂钦(中)、总经理朱佳建(右)、业务协理王毅光认为这是台厂的菜。李立达摄

NVIDIA的GB200何时出货,万众瞩目,被点名可能影响出货原因在于散热,然散热业者指出,原本被视为出货瓶颈的快接头(QCD)已不缺,反倒是冷却液分配装置(Cooling Distribution Unit;CDU)供货时间较长,此也带来台厂新机会。

市场传出,GB200机柜恐将延后1季到2025年第2季以后才会放量,然何谓「放量」,并无明确定义。广达、富士康等ODM厂都强调量产规划时间不变,却未明确说明量产有多少。

市场传出,GB200机柜恐将延后1季到2025年第2季以后才会放量。李建梁摄

市场传出,GB200机柜恐将延后1季到2025年第2季以后才会放量。李建梁摄

众说纷纭下,目前业界普遍共识是,2025年GB200出货强劲可期,且量会逐季拉升。

至于GB200卡关瓶颈?之前台积电的CoWoS封装状况已解,如今有人点名是散热元件问题,也有人提及,是连接器出现问题,亦传出是NVLink相关零件卡关。若以散热元件来说,相关业者指出,并非技术无法赶上,而是产能因素吃紧。

之前曾经传出,快接头缺货是瓶颈,然随着国际大厂量能拉升,且NVIDIA开始出面认证更多厂商,也解决供货吃紧问题,业界人士笑称,现在快接头满街都是,反而供货较吃紧的是CDU。

延伸报导专讲堂:AI基础建设:冷却技术

业界指出,CDU的供货时间约达4~6个月,甚至更久,主要因为其中的零组件,包括板式热交换器、马达、流量计供货时间都长,再加上组装测试,因此时间拉长。

另一说法是,2家国际CDU大厂:Vertiv、BOYD的上游供应商重叠,双方在抢产能,导致供货不足。

因应市场急迫需求,国内散热解决方案商元钛正在扩厂。元钛原本总部设在林口,将迁移至汐止,现有的林口将全部改为生产线,主要生产CDU与Sidecar,元钛董事长陈茂钦指出,规划在汐止另外设厂,预计2025年完工,为新产品预作准备。

元钛目前已经量产1,300 kW的CDU,新款的2,500 kW的CDU正在打样,将送到NVIDIA认证,预计2025年通过认证后量产。元钛总经理朱佳建指出,1,300 kW主要是因应NVL72需求,其单机柜的散热需求就达到120~130 kW。

元钛经营团队早在1997年就在美商爱美达(现在的BOYD)从事散热产业,尔后转战美商Vette倍亿淂科技,属于液冷散热老前辈。2022年创立元钛后,协助华硕、广达打造国家高速网络数据中心的水冷散热系统,2024年6月纬创宣布参与元钛现增。

陈茂钦表示,相对于美商,NVIDIA揭开的这场液冷散热比赛,对元钛很有利,他说,美国厂商都是老同事,然美厂开发速度没有台厂灵活,当大家都在抱怨NVIDIA迭代太快时,这反而是元钛的菜,因为台厂习惯速度快,相较同业,元钛leadtime更短。

朱佳建指出,这2年的主流会是sidecar,因为客户案场没有足够的冰水来源,除非重新建置管线,卡在机房无法停工,因此会用sidecar因应,目前都会是1柜NVL 72对2柜sidecar或2柜NVL 72对3柜sidecar设计。

朱佳建表示,现阶段频传GB200机柜过热,追根究底是芯片封装设计问题。因其封装接合导热效果不佳,芯片内温度偏高,只好提高冷却设备风量。现阶段GB200的机柜散热需求为120~130 kW,2025年推出的B300,甚至可能会直接跳到150 kW,水冷势在必行。

责任编辑:陈奭璁