智能应用 影音

透过直接水冷或两相浸没式技术 解决AI机柜散热问题

2020/11/19 - DIGITIMES企划

尽管随着今(2020)年COVID-19(新冠肺炎)疫情影响,让线上工作成为新常态,反倒加速企业数码转型进程,让诸多ICT技术呈现活络态势。但以数据中心而论,并未如其他ICT技术生龙活虎,较往年平静许多;对此,浸淫信息机房领域逾20载的宽普数码科技总经理朱铭隆认为,主要因为数据中心的产品愈来愈趋同所致,大家能端出的功能与技术差异不大,自然较难激起火花。

朱铭隆表示,回首过去20多年,他带领团队专注执行机房设计与建置,始终站在业主夥伴的角度,用心看待数据中心的大小问题。即便今年数据中心技术圈相对平静,他仍认真盘点一些可望对业主机房产生实质助益的重点技术,大致包括组模化机房、UPS锂铁电池、DCIM、IoT网安等项目,另外更让他备感兴趣的技术是直接水冷,只因它将是未来CPU和GPU倚重的关键散热手段,相当值得关注。

一直以来IT设备大致上均采用空气散热技术,其中最重要的产品为散热片;未来若改采直接水冷模式(将液体引入CPU/GPU的液体冷却模块做直接冷却)。这个新模式之所以受到大家瞩目,源自于介质问题,因为液体带走热的速度与量,比空气快上许多。

朱铭隆说,未来在多数数据中心内部,可能有某几个柜体非常热,系因它们承载AI运算工作,内置许多GPU,因此可透过直接水冷方式来提高散热效率。以某个支撑AI云服务的国家级超级电脑中心为例,便全数采用水冷方案。

此外还有另一种新方法可解决散热问题,称之为两相浸没式技术;深究其运作原理,主要借助一种液体(例如Novec7100),因为CPU表面温度70几度,可将Novec由液体转化为气体,透过这种巧妙的方式把热带走,如此可以达到支持一座机柜≧50Kw的电力负载时热的移除。

「空气冷却模式已到了极限值,」朱铭隆指出,随着CPU愈来愈容易发烫、耗电,而GPU更有过之而无不及,所以水冷技术迟早进入数据中心领域。许多企业或公务机关非常重视PUE,总期望PUE可以低到1.0x%优异水准;如果沿用气冷散热模式,不论内部是走下吹风或In-row Cooling型态,在不考虑自然冷却状态下,PUE下探到1.2~1.3已是极限,不太可能走低至1.1以下,要到达这麽低的水准,唯有水冷一途。

另一方面,宽普近年也积极推广数据驱动的机房监测管理系统「zDCIM」,它是一套奠基于HTML5网页技术的环控系统,对于业主夥伴最为公平透明,将所有传感器封装为HTTP、SNMP、MQTT、BACNET、MODBUS等工业标准,且所有传感器皆为网络IP化,因而易于扩充和维运,且让系统不需依存于任何特定硬件架构,而用户也能自由设定感兴趣的物件对象及数据趋势图、掌握每一个电力细节,并透过任意载具呈现监测结果。


图说:宽普数码科技总经理朱铭隆认为直接水冷,将是未来CPU和GPU倚重的关键散热手段,相当值得关注。