中国储能网讯:
引言
尽管冷板式液冷目前是全球数据中心的主流冷却方式,且预计未来在中国将有约90%的数据中心采用此技术,但浸没式液冷(Immersion Cooling)作为另一种重要的冷却方案,同样备受瞩目。
根据Dell‘s Oro Group的预测报告显示,全球数据中心液冷市场中浸没式液冷的份额预计将逐渐上升。
来源:Dell‘s Oro Group
浸没式液冷的定义、分类及工作原理
1、定义
浸没式液冷是指将发热的电子元器件(如CPU、GPU、内存和硬盘等)整体或部分地直接浸没在装有非导电惰性流体介质(即冷却液,Coolant/Cooling Fluid)的机箱(如Tank、Tub或Pod)中,实现循环散热的一种液冷方式。与直接芯片液冷(即冷板式液冷)类似,浸没式液冷系统也分为两个循环:一次侧循环和二次侧循环。
在一次侧循环中,室外冷却设备如冷却塔或冷水机组与热交换单元(包括CDU、流体冷却器、其他热交换器等,为方便起见,下文统一用CDU表示)进行热交换,从而带走冷却液中的热量。
而在二次侧循环中,CDU则与液冷箱内的IT设备进行热交换,将IT设备产生的热量传递给冷却液。这样,通过两个循环的协同作用,浸没式液冷系统能够高效地将IT设备的热量散发出去,确保设备的稳定运行。
2、分类及工作原理
根据冷却液在循环散热过程中是否发生相变,分为单相浸没式液冷(Single-Phase Immersive Cooling)和双相浸没式液冷(Two-Phase Immersive Cooling)。
2.1 单相浸没式液冷(Single-Phase Immersive Cooling):液体通过液-液热交换器传递热量
(1)单相浸没式液冷采用具有高沸点的冷却液,如碳氢化合物(包括矿物油、植物油等)、硅基油。这些冷却液在吸收热量后仍能保持稳定的液态,从而确保了在现有泵、管道和散热设备(热交换器、冷却塔、冷水机组或干式冷却器等)中的安全应用。由于散热过程中冷却液几乎不蒸发,因此无需使用气密密封容器。
(2)根据冷却液的循环方式,单相浸没式液冷可分为泵驱动和自然对流两种类型,但以泵驱动为主。
泵驱动系统核心是CDU(Coolant Distribution Unit,冷却液分配单元),该单元由泵、热交换器、传感器和过滤器组成,泵驱动冷却液在Tank内部循环以吸收电子元器件的热量。加热后的冷却液进入CDU,并与室外冷却设备的低温液体进行热交换而得到冷却,随后低温冷却液返回冷池,完成整个循环散热过程。
自然对流则利用液体受热后体积膨胀、密度减小的特性,实现较热冷却液的上浮和冷却后的下沉,从而完成循环散热。
(3)从本质上讲,单相浸没式液冷系统是一个倒置的、充满了单相电介质流体的机架——服务器不再是水平安装,而是垂直安装。
(4)对于数据中心应用而言,CDU通常作为独立组件安装在Tank附近或数据中心周边。然而,在某些情况下,集中式CDU也可能被采用以满足特定的散热需求。
单相浸没式液冷循环
来源:GRC、Submer
2.2 两相浸没式液冷(Two-Phase Immersive Cooling):在遇热的情况下由液态转化为气态,然后通过冷凝器将气态冷却液转化回液态
(1)两相浸没式冷却与单相浸没式冷却在原理上基本一致,但存在一个关键区别:两相浸没式冷却液必须能够在受热时从液态变为气态。这一特性使得两相浸没式液冷技术能够更有效地利用相变潜热进行散热,从而提高散热效率。
(2)两相浸没式液冷的冷却液以氟化液为主。
(3)两相浸没式液冷技术中,冷却液在吸收IT设备产生的热量后会经历气液状态的转换。具体来说,IT设备被完全浸没在装有低沸点冷却液的密闭罐体中,设备产生的热量被冷却液吸收后,冷却液的温度会升高至沸腾点,从而由液态变为气态。形成的蒸汽会从液体中上升,在罐体内形成气相区。当气相区的冷却液蒸汽与CDU接触后,会凝结成液体并滴落回容器中,再次参与循环。同时,CDU中被加热的冷却液则通过循环冷却系统将热量排出。
两相浸没式液冷循环
来源:GRC
从全球来看,单相浸没式液冷比两相的应用范围更大,成熟度更高,主要是因为:
单相浸没式液冷冷却液价格相对更低,部署成本更低;
风险相对降低:
两相液冷的冷却液氟化液在健康方面面临巨大质疑,随着3M的逐渐停产,以微
软为代表的客户暂停在两相浸没式液冷的布局,未来如何开发出符合条件的两相冷却液将成为大家的关注点。
在两相交换的过程中存在许多潜在的风险。例如,相变的存在要求液冷系统必须保持密闭,以防止蒸汽外溢流失,在相变过程的气压变化可能会使系统中产生非常高的压力,对系统的安全性提出了更高要求;大多数两相冷却系统需要将水直接引入数据中心以冷却冷凝器并去除热量,这增加了数据中心的故障风险 。
相变过程中产生的微空化现象可能会侵蚀IT设备和冷却系统的金属部件,导致设备故障和金属颗粒污染。
需要的维护少,如果需要调整,更容易进入和维修。
浸没式液冷的关键零部件和供应商
浸没式液冷系统的核心组成部分为芯片和IT设备、机箱(Tank)、CDU和冷却液。
1、芯片和IT设备厂商
Intel(美国)、NVIDIA(美国)、曙光(中国)、Iceotope(英国)、HPE(美国)、Dell Technologies(美国)、Super Micro(美国)、iXsystems (美国)、AMAX(美国)、2CRSi(法国) 、IBM(美国)、Quanta Computer(中国台湾)、CISCO(美国)、Penguin Computing(美国)、GIGABYTE(中国台湾)、LiquidCool Solutions(美国)、Hypertec(加拿大)、Boston Limited(英国)。
2、机箱(Tank)
典型厂商:Submer(西班牙)、GRC(美国)、TMGcore(美国)、Modine(美国)、Firmus(澳大利亚)。
3、冷却液分配单元(CDU)
浸没式和冷板式CDU密封材质和泵不一样,功能设置也有差别,现在基本是定制的。
典型厂商:国外CDU厂商主要有GRC(美国)、Submer(西班牙)、Vertiv(美国),国内有中航、高澜等。
4、冷却液(Coolant/Cooling Fluid)
考虑到短路和电化学腐蚀,在选择冷却液时,主要考虑的是避免电气短路的能力以及安全和健康问题,无毒能力,良好的化学稳定性和不可燃性,此外,全球变暖潜力(GMP值)也很重要。
典型厂商:3M Novec(将于2025年停产,美国)、Shell (荷兰)、Cargill(美国)、ExxonMobil(美国)、SK Enmove(韩国)、Chemours(美国)、Castrol(英国)、ENEO(日本排名第一的润滑油公司)、Solvay(比利时),Honeywell(美国)、Envirotech(美国)、DXC Technology(美国)、Engineered Fluids(美国)、思康(中国)、诺亚化工(中国)。
5、集成商
典型厂商:Midas Green Technologies(美国)、GRC(Green Revolution Cooling,美国)、Submer(西班牙)、TAS(美国)、MIVOLT(英国)、THPC(意大利)、XComputing Technologies(印度)、Asperitas(荷兰)、Zutacore(美国)、LiquidStack(美国)、绿色云图。
6、全球浸没式液冷用户(大部分处于试点阶段)
服务提供商:Microsoft(美国)、Meta(美国)、 阿里云、ResetData(澳大利亚云服务提供商)、STT GDC(新加坡)、OVHcloud(法国)、NTT Data(日本)、Standard Power(美国俄亥俄州,加密挖矿数据中心公司)、OneAsia (香港)、Macquarie Data Centres(澳大利亚)、Bytesnet(荷兰)、ZELEN DATACENTAR(塞尔维亚)、Infosys 、百度。
教科研:Vienna Scientific Cluster(奥地利)、东京工业大学(日本)、德克萨斯州高级计算中心(美国)、约翰·保罗大帝天主教大学(美国)。
通信:Telefónica(西班牙)、中国电信、中国移动。
金融:Crédit Agricole(法国农业信贷银行)、中国银联。
石油天然气:CGG(法国)、Down Under Geo Solutions(DUG)(澳大利亚)。
政府:美国空军、美国国家安全局物理科学实验室、美国国防部、美国能源部、国家超级计算中心深圳中心、合肥先进计算中心、国家超级计算郑州中心、国家超级计算成都中心、国家超级计算昆山中心。
其他:CBT Nuggets
浸没式液冷—全球产业链图谱
来源:编者整理
浸没式液冷面临的挑战和发展方向
1、以3M为代表的氟化液被证明属于PFAS化学品,被对人体健康具有长久的危害,已被多个国家限制,未来研发符合政策要求的冷却液将成为重点。
以Fluorinert™和Novec™两大系列为代表的3M 电子氟化液此前广泛应用于数据中心液冷,其中3M™ Fluorinert 电子氟化液主要应用于数据中心单相和两相浸没式液冷;而3M™ Novec™电子氟化液体既可用于数据中心浸没式液冷(单相和两相),也可应用于冷板式液冷(单相和两相)。
近年来,各国政府和环保机构对PFAS化学品所带来的危害越来越关注。美国环保署署长迈克尔·里根(Michael Regan)于2021年初成立了美国环保署PFAS委员会,并于2022年3月公布了研究结果,表明PFAS可能会影响人类的生殖和发育,损害免疫系统并增加患某些癌症的风险。欧洲化学品管理局(ECHA)也发表了类似的发现,欧盟表示希望到2025年限制所有PFAS化学品。包括加拿大、澳大利亚和亚洲在内的其他地方的监管机构也开始注意到PFAS的风险。
2022 年 12 月 20 日,3M 宣布计划在 2025 年底前逐步淘汰其PFAS 化学品产品线,Fluorinert和Novec冷却液首当其中:
“3M今天宣布,计划退出全氟烷基和多氟烷基物质(PFAS)的生产,并努力在2025年底前停止在其产品组合中使用PFAS。这一投资组合决策基于对外部环境的仔细考虑和全面评估,包括多种因素,例如加速监管趋势,重点是减少或消除环境中PFAS的存在,以及改变利益相关者的期望“。
来源:3M官网
注:PFAS化学品,也称为全氟烷基和多氟烷基物质,属于人造化学品,在环境中具有高度持久性,不易分解,自 1940 年代以来被广泛使用, 2023 年 5 月,美国环保署 提出了“PFAS”一词的定义:至少包含以下三种结构之一的化学物质:
1. R–(CF2)–CF(R′)R“,其中 CF2CF部分是饱和碳
2. R-CF2OCF公司2–R′,其中 R 和 R′ 可以是 F、O 或饱和碳
3. 囊性纤维化3C(CF3)R′R“,其中R′和R”可以是F或饱和碳。
由于以3M为代表的氟化液被归类为PFAS化学品,对人体健康具有潜在危害并受到多国限制,未来浸没式液冷技术将更加注重环保冷却液的研发。未来的冷却液不仅需要具备出色的热传导性能,还需满足低毒性、易回收和生物可降解等环保标准。此外,冷却液的稳定性和长寿命也是研发的重点,以减少频繁更换和维护的成本。
2、应用解决方案有待成熟
浸没式液冷技术的广泛应用需要一套完整且便捷的应用解决方案作为支撑,涵盖从设备的上下架、运维管理、清洗操作到溶液处理等多个方面。然而,当前市场上缺乏这样成熟且完善的解决方案,这在一定程度上限制了技术的推广和应用。随着众多企业和研究机构的投入,解决方案逐步成熟,浸没式液冷技术市场有望迎来全新的发展机遇。
3、运维难度大
浸没式液冷需要改变现有的维护流程,冷却液需要特殊处理,且遭遇故障时需要将服务器从冷却液中取出,对IT运维人员提出了新的技能要求。未来AI与浸没式冷却的融合将成为重要发展方向。为确保浸没式IT设备的长期稳定运行和性能优化,冷却液的持续监测与分析至关重要。AI技术的引入,使得冷却系统能够实时监控流体状态,预测性能退化趋势,并及时进行维护或更换。此外,基于AI的预测性维护系统利用大数据分析,可准确预测未来的维护需求,从而显著降低数据中心运营成本,提高资源利用效率。
4、成本高
首先,数据中心采用浸没式冷却需要重新铺设管道,为温水回路铺设冗余管道。其次,浸没式液冷需要使用专用的冷却液,且用量大,建设成本高。
5、IT设备兼容性问题
浸没式液冷技术需要根据IT设备定制冷板,不同型号的设备可能需要不同的冷板设计,这增加了技术推广的复杂性。
为进一步提高冷却效率,以英特尔和英伟达等科技巨头为代表的公司不断探索浸没式液冷技术。英特尔通过设计创新的散热器结构、涂层技术和封装技术,如珊瑚形散热器、沸腾增强涂层和微型喷射器等,不断提升其产品的冷却效果。而英伟达则倾向于将直接到芯片液冷(DLC)与浸没式液冷的优势结合,创造出一种全新的混合冷却方案,这种方案倾向于保留大多数风冷和直接液冷机箱中使用的标准机架安装外形,将IT设备主板浸入冷却液中,同时CPU和GPU采用直接液体冷却,旨在完全消除风扇的使用,同时保持IT设备的标准机架安装外形,从而为数据中心带来更高的能效和更低的噪音水平。预计2026 年将推出测试系统,其主要合作伙伴包括BOYD Corp、 Durbin Group、Honeywell、Vertiv、宾厄姆顿大学、维拉诺瓦大学、桑迪亚国家实验室。
英伟达结合DLC和浸没式液冷的技术
来源:英伟达官网
总结
(1)中国未来在很长一段时间内还将以冷板式液冷为主,相比之下,全球在浸没式液冷的布局和发展更快。
(2)与两相浸没式液冷相比,单相液冷在成本、风险和运维难度方向相对较低,应用相对成熟。
(3)尽管浸没式液冷在技术上拥有一些优势,但由于冷却液的限制、解决方案的成熟度不高、运维难度大、成本高以及IT设备兼容性等方面的限制,目前尚未实现大规模推广。