摘要:伴随人工智能、云计算、大数据等产业的加速发展,数据中心的需求量、规模和建设力度都显著提高。然而,数据中心能耗问题日益严重。由于传统数据中心能耗的很大一部分源于冷却系统,因此有必要利用新兴液冷技术建设绿色数据中心。本文介绍现有数据中心可用的液冷技术(冷板、喷淋和浸没)及其基本工作原理,指出不同液冷技术近5年(2019—2023年)的最新进展与相关研究方向,以及不同液冷技术现存的一些难点问题。
随着“新基建”和“东数西算”的提出和实施,以及人工智能、云计算、大数据等产业的加速发展,数据中心的需求量、规模和建设力度都有了爆炸式提高。数据中心内部存放的计算、存储、网络等IT(informationtechnology,信息技术)设备,主要用于大量信息的集中处理、存储、传输、交换和管理,这导致其消耗了大量的能源,数据中心的能源消耗约占全球用电量的3.5%。数据中心运行过程中会产生大量的热量,为维持设备正常运行,其必须的制冷系统能耗约占数据中心总能耗的30%。如何降低数据中心制冷系统的能耗成为解决其高能耗的关键问题之一。
目前,评价数据中心的能耗时较为普遍采用的是PUE(powerusageeffectiveness,电能利用效率),其结果为数据中心总能耗与IT设备总能耗的比值。根据工信部印发的《新型数据中心发展三年行动计划(2021—2023年)》,到2023年底,新建大型及以上数据中心PUE值必须低于1.3。GB40879—2021《数据中心能效限定值及能效等级》要求一级能效数据中心PUE值至少控制在1.2以内。需要众多科研学者的共同努力,逐步攻克数据中心现存的大量关键技术难点。
芯片的TDP(thermaldesignpower,热设计功耗)逐步增大,有些芯片甚至达到了360W。这对于传统数据中心使用较为普遍的风冷式散热技术,其服务器芯片散热遇到严重挑战,一般来说,5~10W/cm2左右的热流密度已经达到了风冷式散热技术的极限,更高的热流密度非常容易导致大量热量无法及时排出芯片。为解决这一问题,目前数据中心可采取的主要措施为液冷散热技术。通常来说,液体的热性能远远优于空气,其导热系数约为空气的15~25倍,比热容甚至为空气的1000~3500倍。液冷散热技术在换热方面表现出了风冷式散热技术远远达不到的优越性能。国家发展改革委等部门发布《关于严格能效约束推动重点领域节能降碳的若干意见》,明确鼓励重点行业利用绿色数据中心等新型基础设施实现节能降耗,液冷技术成为国家及地方政策的推广对象。
笔者将按照冷却液是否与被冷却器件接触介绍不同形式的液冷散热方式的最新进展及现存问题,包括非接触式冷却(主要为冷板)和接触式冷却(主要为浸没和喷淋),如图1所示。
1 冷板冷却技术
1.1 最新进展
图1(a)所示为冷板冷却。从图中可以发现,冷却液在冷板中特定的流道中流动。因此冷板冷却技术为非接触式间接液冷技术。相较于喷淋和浸没液冷技术,冷板液冷技术无需考虑冷却液导电问题,可选用的冷却液种类较多,如去离子水、纳米流体等,其热物性一般优于绝缘冷却液。此外,冷板流道结构的优化可以增大对流换热面积或提高对流换热强度,从而有效强化换热。目前,数据中心的冷板冷却技术主要用于芯片液冷,主要研究方向为通道拓扑优化。
冷板通道拓扑优化的主要目的是通过优化流道结构,进而改变冷却液的流动特性,以此强化冷却液与芯片间的换热。优化流道结构的一个思路为降低冷板整体压降减小泵功,以此降低数据中心能耗。冷板通道的结构优化被认为是提高液冷系统性能的关键。目前研究人员研究了不同的通道结构,包括板翅形、波浪形、针肋形和球形等,设计了一些新型通道结构,如歧管式通道、双H形歧管通道、渐高翅片分流通道、交叉肋通道、菱形分流通道和分级歧管通道及并联矩形突扩通道等。通道优化方法除了人为改变流道结构,也可使用其他方式进行拓扑优化,如遗传算法、参数优化和理想解法等。
目前冷板冷却技术采用的工质主要为水,也有研究人员尝试在冷却液中添加其他物质,寻找或制作其他类型冷却液,进而获得相较于原冷却液更加优异的换热性能,主要包括:氮化铝-氧化铝-水混合纳米流体、碳化硅-水混合纳米流体、HFE-7100氟化液、R113制冷剂和FC-72水乳液等。
虽然采用冷板单相冷却技术(即使用高沸点冷却液,在换热过程不发生相变)的系统结构简单,但冷板相变沸腾换热逐渐成为热点,主要目的是使冷却液达到一定温度后汽化吸热,从而有效降低芯片温度,获得更均匀的温度分布,同时可以降低泵功。目前,对于强化冷板通道内沸腾换热方式的研究主要有改变表面润湿性、添加表面活性剂、使用均流腔,或者通过改变流道结构,如:使用分段式梯形通道结构,利用表面张力驱动汽化工质间断向流道两侧流动,维持中心加热点为液态区,实现气液分相流动,进而强化沸腾;使用开口型水滴结构,可以增大换热面积,并增加凹凸点的数量,有利于形成更多的汽化核心,进而强化沸腾。如图2所示,冷板冷却从第一代远端散热,到第二代穿透式散热,到第三代的嵌入式散热,实现冷板冷却效果的量级提升,最高散热热流密度达到了1723W/cm2。此外,还有一些优化冷板散热的新型方式,如将纳米复合P(MEO2MA-co-OEGMA)水凝胶填充于通道立柱结构,并利用水凝胶的热敏性,根据热负荷变化自行调节阀通径,冷却液流量可从0.14mL/s升高至0.46mL/s。与传统通道相比,自适应通道结构在达到相同制冷量的同时,COP(coefficientofperformance,性能系数)提高了一个数量级。
1.2 现存问题
冷板冷却方式与其他冷却方式相比,具有结构紧凑、工艺相对成熟、冷却液可选类型较多等优势,此外,冷板可通过微通道直接集成于芯片中,实现芯片级液冷。
冷板冷却技术目前存在的问题主要有以下几点:
1) 在冷板内的两相沸腾流动,能够显著增强流道内的对流换热强度,同时有效改善微通道热沉的均温性,但微通道内的汽化相变产生的气泡存在不稳定性,由于目前对气泡动力学机制尚不清晰,可能会导致通道内的“气塞”和“返流”现象,导致流动不稳定引起传热恶化;
2) 由于黏滞力,冷板流道的冷却液会沿着流动方向产生巨大的摩擦损失,这会明显增加泵的功耗;
3) 使用微通道的冷板热沉可以通过缩小流道的尺寸,增大换热面积,以此强化换热,但液体黏度限制了流道尺寸的设计下限;
4) 冷板微通道流道尺寸越小,加工工艺越复杂,而过小的流道尺寸非常容易因混入杂质而堵塞;
5) 冷板微通道由于水力直径与流动长度的比值非常小,冷却液在流道出口甚至可能会有数十摄氏度的温升,并造成微通道热沉温度分布极不均匀;
6) 硅基冷板微流道散热能力强,但脆性大,结构可靠性差,优化材料和结构以提高整个微流道冷却系统的可靠性是目前需要研究并解决的关键问题;
7) 由于较大的比热容和导热系数以及极低的价格,水被认为是微通道液冷性价比最高的冷却液,但其具有一定的腐蚀性和导电性,且存在泄漏的可能性,因此寻找性能更加优异且价格低的替代品成为当务之急;
8) 微尺度下的流动及传热特性相较于常规尺度存在显著差别,微通道内流体流动和传热的机制有待继续研究。
2 喷淋冷却技术
喷淋冷却技术应用于数据中心时,常通过使用喷淋板对服务器内各电子器件进行接触式的冷却,其中射流冷却技术和喷雾冷却技术是可以获得更高热流密度散热的2种技术。
2.1 射流冷却技术
2.1.1最新进展
图3(a)所示为射流冷却技术。射流冷却的基本工作原理为将流体从喷嘴中喷出,高速流体冲击芯片上表面后,形成非常薄的速度边界层和温度边界层,形成较强的对流换热,进而将热量从芯片中排出。
最初射流冷却使用的工质是空气,由于液体具有更好的热性能,液体射流冷却逐步成为研究热点。目前,射流冷却方式不仅可用于芯片液冷,也可用于其他发热元件的冷却,如显卡、内存条和硬盘等。当前,射流冷却技术主要研究方向为射流传热结构优化(喷嘴孔型、喷嘴排列方式和冲击表面结构)、射流高效冷却液和射流沸腾换热。
射流喷嘴孔型优化的主要目的是通过改变喷嘴的形状,进而改变冷却液在喷嘴出口处的速度矢量,使其冲击在芯片表面时,产生不同的流动特性,以此强化冷却液与芯片间的换热。喷嘴孔型优化的一个思路为降低冷却液出口压降以减小泵功。目前,较为常见的喷嘴孔型为圆形、方形和矩形喷嘴。研究人员对比分析了旋转射流(十字形、内十字形和花形3种螺旋喷嘴,如图3(b)所示)的散热结果,结果表明,在相同条件下,旋转射流的平均换热能力优于传统圆孔射流,十字形和花形螺旋喷嘴在滞止区的换热效果优于内十字形螺旋喷嘴,内十字形和花形螺旋喷嘴在冲击面外缘的换热效果优于十字形螺旋喷嘴,总体上花形螺旋喷嘴的换热效率和换热均匀性更好。
射流喷嘴排列方式,即阵列射流冷却的主要目的是改善芯片整体的温度均匀性。具体来说,单孔射流能够在滞止点处形成强烈的对流换热,当流体逐步远离滞止点后,对流换热系数快速衰减,最终导致芯片表面温差过大;阵列射流将喷嘴阵列排布,在芯片表面形成多个强对流换热区域,进而有效改善整体温度均匀性。目前,较为常见的喷嘴排列方式有直线形排列、六边形排列和交错排列。V.S.Devahdhanush等的研究结果表明,射流速度相同时,阵列射流的临界热流密度高于单孔射流,但在质量流量相同时其临界热流密度较低。卜诗等研究了格子阵列射流,结果表明格子阵列射流能够显著提升双层冷却结构的整体传热效果,相较于传统光腔结构,在无附加横流的条件下内腔采用格子阵列可使全域平均传热提高28.7%。铁鹏等针对氮化镓芯片的局部散热需求,研究了阵列射流冷却对点状热源的散热效果。
射流冷却表面结构优化的主要目的是通过改变流体在表面的流动特性,同时增大换热面积和增加汽化核心强化冷却液与芯片间的换热。射流冷却的冲击表面可分为光滑表面和粗糙表面2种类型。目前,常见的射流冷却粗糙表面包括肋状、针翅、凹凸表面等。吴青等研究了阵列射流下扰流柱对换热的影响,结果表明相对于射流孔的位置,顺排扰流柱的换热能力优于叉排扰流柱,其换热能力相较于无扰流柱时增大了约30%。
相较于微通道液冷,射流冷却的冷却液会与服务器内的电子元件直接接触,射流冷却所需的冷却液必须是绝缘低腐蚀介质。因此,射流冷却可以选用的冷却液类型较少,可以考虑的射流冷却液包括硅油和氟化液。在不考虑绝缘腐蚀的前提下,射流冷却液主要包括:R134a制冷剂、HFE-7100氟化液、HFE-7000氟化液和氧化亚铜-水混合纳米流体等。
射流冷却可利用两相沸腾强化换热。当芯片温度较高而冷却液沸点较低时,射流冲击于芯片表面的冷却液会沸腾,并汽化吸热。近5年来,研究人员主要对以下射流沸腾换热强化方式进行了研究:
1) 射流冲击面使用混合结构(热沉表面中心具有三角凸棱柱,在壁面射流区使用微通道),在1367W/cm2热流密度下,加热表面温度保持在86.5℃以下,证明射流沸腾在混合结构上具有优异的散热表现;
2) 射流冲击面使用珠粒填充多孔层,可以增大沸腾换热面积,增加汽化成核位置,并通过光滑平面对照组发现,在相同条件下珠粒填充多孔层使换热系数和临界热流密度分别提高1.5倍和2.5倍;
3) 使用激光刻蚀射流冲击面的镍/石墨烯微纳复合结构,其换热能力相较于微针肋表面提升了119.8%,表明沸腾换热受射流冲击面结构形貌及其制备工艺的影响极大。
此外,研究人员也研究了不同肋化结构对于射流沸腾换热的影响。
2.1.2现存问题
与其他液冷技术相比,射流冷却技术的优点为:①相对较低的压降;②能够通过使用多个射流阵列在大表面积上保持较高的温度均匀度;③能够使用一个冷却系统冷却多个复杂形状的设备;④射流工质具有较高的动量,可适用于微重力环境。
射流冷却技术目前存在的问题主要有以下几点:
1) 射流冷却出流工质冲击面的滞止点处具有最高的对流换热系数,但随着冷却液远离滞止点,其对流换热系数快速衰减,导致冲击面温度变化梯度太大,整体的温度均匀性较差。
2) 阵列射流冷却可以在冲击面形成多个强对流区域而有效改善温度均匀性。但喷嘴数量增多会导致单个喷嘴出口流速减缓,对流换热强度下降;若喷嘴数量过少会导致冲击面的温度均匀性达不到要求。因此,采用阵列射流冷却时,要对其结构参数进行优化设计。
3) 阵列射流相邻喷嘴间出流冷却液会相互干扰,阻碍流体正常流动,导致对流换热能力有所下降。
4) 射流冷却技术的主要研究方向集中于芯片上表面的冷却,较少关注芯片的其他表面的协同冷却,表面利用率明显不足,如图4(a)和图4(b)所示。多面协同冷却有助于进一步强化综合换热,如图4(c)所示。
5) 相变射流冷却技术存在临界热流密度的限制,当芯片温度过高,冷却液会在芯片表面快速汽化,形成蒸汽膜,严重影响冷却液与芯片间的换热。因此,如何提高其临界热流密度成为相变射流冷却技术的关键问题之一。
6) 较高的射流出流速度能够强化对流换热,将电子器件的温度迅速降低,但受限于电子器件的结构强度,当射流出流速度过高时,可能会导致设备的损坏。
2.2 喷雾冷却技术
2.2.1 最新进展
图5(a)所示为喷雾冷却技术。如图所示,喷雾冷却的基本工作原理为将冷却液经雾化喷嘴雾化为小液滴,并喷在芯片热表面上,由于液滴直径较小,可以迅速吸热蒸发,从而有效降低芯片表面温度。喷雾冷却与射流冷却最大的区别在于,射流出流工质为连续成股的流体,而喷雾出流工质为微小单独的液滴。相较于射流冷却,喷雾冷却的显著特征为换热过程以相变为主,同时可减少换热过程的质热浪费。当前,喷雾冷却技术主要研究方向为:①喷雾传热结构优化(雾化结构和散热面结构);②喷雾高效冷却液;③喷雾冷却传热过程。
优化喷雾传热结构的主要目的与射流冷却较为相似,但喷雾冷却更加复杂,影响其换热效果的参数较多,如液滴直径、液滴分布、不凝结气体等。散热面结构优化被认为是喷雾冷却换热能力的重要途径之一。喷雾冷却的散热面可分为2种类型:光滑表面和粗糙表面。目前散热面的结构优化主要有3种方式:改变表面结构、改变表面粗糙度和涂抹表面涂层。吴正人等研究了空心锥压力旋流喷嘴喷雾冷却的换热效果,结果表明,当入口压力上升时,雾化液滴数量增加,有效提升了液体散热面碰撞的次数,使得散热面的液膜变薄,在2.0MPa下,空心锥压力旋流喷嘴表现出最优的换热性能。张伟等研究了微孔阵列雾化喷嘴,结果表明,相较于单雾化喷嘴,微孔阵列雾化喷嘴能够产生更加均匀的液膜分布,获得更优的散热面温度均匀性。在相同条件下,当过热度大于10K,微孔阵列雾化喷嘴比单雾化喷嘴的临界热流密度提高16%。黄诗雯等研究对比了光滑散热面和方肋散热面的换热效果,结果表明,方肋散热面的传热系数始终优于光滑散热面,当喷雾高度从29mm降低至14mm,散热面的传热系数增大72%,当喷雾流量从20L/h增加至32L/h,散热面的温度降低2.4K。YuY.X.等研究了平面散热面和直槽散热面的换热效果,结果表明,与平面散热面相比,直槽散热面显著提高了喷雾冷却的换热性能。随着槽深的增大,热流密度先增大后减小。
与射流冷却类似,喷雾冷却的工质同样与电子器件直接接触,所需的冷却液必须是绝缘低腐蚀介质,且沸点较低,因此选用的冷却液类型相对更少,如:部分低沸点氟化液,部分制冷剂。在不考虑绝缘腐蚀的前提下,研究的喷雾冷却液包括:HFE-7000、R134a、液氮、R1336mzz、十二烷基硫酸钠水溶液、乙二醇、FS-31非离子表面活性剂和高醇表面活性剂等。
值得注意的是,自2016年干冰升华喷雾冷却技术概念被提出后,受到越来越多的学者的关注。图5(b)所示干冰升华喷雾冷却的基本原理为:将高速高压的液态二氧化碳流体通过窄小细缝或喷嘴喷出,液态二氧化碳在细缝内发生焦耳汤姆逊效应,压力急剧降低并形成细小干冰颗粒,随后被喷射至散热面,升华并带走大量热量。由于干冰在升华过程中直接由固态转变为气态,散热面不会出现液膜,若能够彻底解决相关技术问题,干冰升华喷雾冷却技术能够应用于未来超高热流密度电子器件的散热。
喷雾冷却属于复杂的多相流问题,目前对于喷雾的传热机制还存有争议。喷雾冷却时,液滴撞击散热面会出现明显的流态变化,而这极大影响了喷雾冷却的传热特性,为探究液滴撞击过程中液滴形态演变及其影响因素,可使用的技术包括:高速摄影、粒子图像测速、全内反射成像、红外热像和高速阴影。周年勇等研究了喷雾冷却瞬态传热过程,发现喷雾冷却散热面的温度变化有3种模式:模式Ⅰ,散热面迅速降温至核态沸腾区某点直至平衡;模式Ⅱ,散热面持续升温至膜态沸腾区某点直至平衡;模式Ⅲ,散热面温度先在过渡沸腾区达成暂时的平衡,直至某一刻平衡被打破,并最终在核态沸腾区实现平衡。ZhaoX.等捕捉了喷雾在光滑表面上两相冷却状态下的液膜状态,发现随着热通量的增大,连续液膜发生热诱导团聚,最终分散到孤立状态,提出了隔离膜分布和表面平均速度的预测方法。龙文俊等发现喷雾冷却存在热逆转现象,即在一定的热流密度范围内,随着热流密度的增大,散热面温度不升反降。热逆转现象对于对流换热系数的提升作用可高达94.0%,但其仅在热流密度逐渐升高的过程中出现。
2.2.2 现存问题
喷雾冷却具有突出的优势,如:换热能力强、冷却过程中温差小、工质需求量小、没有沸腾的滞后性、与固体表面之间没有接触热阻,这对保证电子元件工作温度在小范围内波动来说是极为重要的。
喷雾冷却技术目前存在的问题主要有以下几点:
1) 当散热面过热度较低时,若雾化喷嘴喷出液滴吸收的热量不足以使其相变汽化,则该喷雾冷却的换热过程仅为单相撞击与流动,整体的换热能力较差。
2) 当散热面过热度增大到一定程度时,接触散热面的液滴全部发生沸腾,在散热面上方产生一层蒸汽膜,将液滴与散热面隔开,形成莱顿弗罗斯特效应,此时,由于蒸汽膜的低导热率,散热性能骤然下降,电子芯片的温度随之迅速升高而损坏。
3) 电子设备的冷却往往需要闭式循环,但对于雾化喷嘴,将液体击碎而产生大量细小液滴,液滴从喷嘴高速喷射而出,在液滴吸热汽化等过程中,都非常容易导致冷却液进入周围环境,长期运行会造成冷却液的明显损耗且对人员健康有一定的影响。
4) 雾化喷嘴的结构非常精细,对于芯片,所需的流量更少而导致雾化喷嘴的流道更小,在实际运行过程中,容易混入杂质而导致喷嘴堵塞,或者雾化喷嘴长期使用而造成磨损,又或者同类型雾化喷嘴的制造工艺中的微小变化,都会对实际喷雾特性产生显著影响,影响喷雾场分布和喷雾冷却效果。
5) 对于面积较大的热源,单个喷嘴的喷雾冷却效果较差。因此,通常采取多阵列的模式,但是多喷嘴阵列喷雾锥会相互作用和干扰,导致出现低动力流区使得液膜流动和液体更新减缓,严重影响了喷雾冷却的换热能力。
6) 虽然微/纳米表面和纳米结构涂层能够改善喷雾冷却换热能力,但随着长期使用,纳米结构涂层可能会脱落,再加上微/纳米表面制备过程和工序非常复杂,导致很难控制表面特性。因此,保持界面的稳定性是微/纳米结构和纳米结构涂层目前亟需解决的问题。
7) 微/纳米表面结构尺度越小,产生的毛细力越大,喷雾的液滴能够很好地铺展于散热面,有利于液滴汽化;但是结构尺度细化到临界尺寸时,会导致液滴无法进入微/纳米结构,如体积分数较大的纳米流体会在微/纳米表面沉积,导致传热削弱。此时,微/纳米表面的效果趋近于光滑表面。
8) 雾化冷却过程需要极高的压力,这会导致消耗较大泵功,因而喷雾冷却需要权衡功耗损失和换热效果。目前喷雾冷却所需的部件较为复杂和繁多,占用的空间较大,需要定期检修,因此喷雾冷却设备研究的后续方向应为设备紧凑和组件模块化。
3 浸没冷却技术
3.1 最新进展
浸没冷却的基本工作原理为将电子设备完全浸入冷却液,通过循环实现电子设备散热。浸没冷却技术属于被动全液冷技术。当前,浸没冷却技术主要研究方向为:浸没传热结构优化(排列方式和散热面结构)、浸没高效冷却液和浸没沸腾换热。
散热翅片高度、散热翅片间距、散热翅片导热系数、折流板高度比、出口面积、进口流量、进口温度等参数会直接影响冷却液的换热效果。HanJ.W.等研究了不同翅片结构浸没冷却传热特性,结果表明,与无翅片结构相比,圆形、矩形和三角形翅片结构浸没冷却的最高温度分别降低了2.41%,2.57%和4.45%,三角形翅片结构表现最优。ChuangJ.等使用金属粉末注射成型工艺制作带有10mm钉肋的散热面外壳,结果表明,钉肋的散热面外壳的热阻相对于标准的散热面外壳减小了40%。
与射流冷却、喷雾冷却相似,浸没冷却的工质同样会与电子器件直接接触,因此,浸没冷却所需的冷却液也必须是绝缘低腐蚀介质。冷却液的热物性决定了浸没冷却效果。根据分子结构特性,浸没冷却液可分为4种:氢氟饱和化合物、氢氟不饱和化合物、全氟饱和化合物和全氟不饱和化合物。在不考虑绝缘腐蚀的前提下,浸没冷却液包括:矿物油、热醇油、碳化硅/白矿物油基纳米流体、NOVEC-649氟化液、R1233zd(E)/乙醇混合工质、二甲基硅油和原椰子油等。
浸没沸腾换热利用冷却液沸腾产生的气泡强化浸没腔内的冷却液流动混合,以此增强对流换热。SunX.Q.等研究了浸没沸腾换热优化,发现在上下热源之间安装挡板,可以防止气态冷却液直接从下层热源上升到上层热源,进而增大了上层热源与液态冷却液的接触面积,降低了表面温度,提高了箱体整体温度均匀性。WangY.F.等将R1233zd(E)掺于乙醇中,发现有效强化了散热面沸腾换热,温度均匀性最高提高57.0%。ZhouG.H.等[100]在浸没冷却中加入蒸汽室并填充梯度毛细芯结构,结果表明,在热源温度低于85℃的情况下,蒸汽室可有效输送500W热负荷,可应对900W的最大热负荷而不达到干涸极限,此时蒸汽室热阻为0.046℃/W。LiJ.等将浸没冷却和喷雾冷却结合,结果表明,在合理控制浸没状态和喷雾压力的情况下,浸没冷却的效果没有被恶化,反而有助于强化传热,最大强化比达到12.2%,若综合使用超声强化换热,相较于传统浸液冷却,超声喷雾浸没冷却的换热能力提高14.4%,并且随着喷雾高度的提升,超声表现出了更优的换热能力,当喷雾高度为18mm时,换热能力提高29.1%。
3.2 现存问题
相对于射流冷却和喷雾冷却,影响浸没冷却换热效果的参数较少,若能够提高冷却液的导热系数则能够大幅提高浸没冷却的性能,电子器件都浸没于冷却液中,因此温度均匀性较好。另外,相较于其他液冷技术,浸没冷却系统相对简单,可靠性相对较高。
浸没冷却技术目前存在的问题主要有以下几点:
1) 浸没冷却尽管能够通过阵列排布同时实现多个服务器的均匀散热,但如果需要散热的电子设备结构较为复杂,当电子设备各处发热量差异较大时,冷却液可能会在电子设备的局部形成流动死区,阻碍冷却液的正常工作循环并导致该区域温度过高[33]。
2) 浸没冷却技术的最大争议是电子设备长时间浸没在冷却液内是否会导致腐蚀,进而影响电子器件的正常功能和性能。
3) 理想浸没冷却液的介电常数、GWP值、绝缘性能等性能指标难以同时满足要求,如何有效达到综合指标要求成为开发浸没冷却液成败的关键问题。
4) 利用自然对流的单相浸没冷却时,由于冷却液相对较低的热导率,导致整体散热效果不佳,两相浸没冷却存在一定的沸腾滞后现象导致沸腾开始时芯片温度过高。
5) 如图1(c)所示,相较于冷板和喷淋液冷,浸没冷却时服务器将浸泡于充足的冷却液中,而浸没液冷所用冷却液的密度通常明显高于去离子水,这导致单个浸没液冷机柜的整体质量远高于冷板和喷淋液冷机柜。而数据中心内可能分楼层存放大量的服务器机柜,这使得楼层底板受到巨大的压力,导致数据中心所需的结构强度和建造成本增大。
6) 对于两相浸没冷却系统,为减少冷却液的损耗,需要保持系统密封,此时,热负荷波动会引起密封腔内的压力波动,因此密封腔内的压力控制成为不可忽视的关键问题。另外,两相浸没冷却传热分析主要涉及电子元件级别的散热表面特征和传热流体的热输运,而针对服务器级别整体传热机制的相关研究较少,仍有待进一步完善。
7) 两相浸没冷却系统压力过高时,会导致壳体鼓胀变形,若密封效果较差时会导致气态冷却液大量逸出,导致冷却液的明显损耗,并可能危害运维人员的身体健康;密封效果较好时,压力升高导致冷却液沸点升高,不利于芯片的温控,对压力敏感电子元件也会受到干扰。
8) 两相浸没冷却系统压力过低时,系统处于负压运行状态,会导致壳体挤压变形,若密封效果较差,会导致外界杂质与不凝性气体进入密封腔,即使密封腔存在少量的不凝性气体也会导致冷凝传热明显恶化;密封效果较好时,液态冷却液大量变为气态,密封腔内液位降低,部分电子器件暴露于气态冷却液,散热极限降低,不利于整体散热,且温度均匀性变差。
4 液冷技术对比分析
以上所述内容总结了3种液冷技术各自的优势和现存的问题。
1) 从基础成本的角度进行对比,对于非接触间接液冷技术(即冷板冷却技术),其基础成本在于冷板材料,对于接触式直接液冷技术(即喷淋和浸没冷却),其基础成本在于冷却液;浸没冷却技术需要大量的冷却液,但当前用于接触式直接液冷的冷却液价格普遍较高,而冷板冷却的冷板材料用量相对较少,且可以选用紫铜或铝,价格相对较为适当。因此,从基础成本的角度进行对比,冷板冷却的优势相对更加明显。
2) 从加工成本的角度进行对比,喷淋冷却的喷淋板加工相对简单,只需要对应发热位置开设喷淋孔位,冷板冷却的冷板通道加工相对繁琐,且要贴合芯片、内存和硬盘等,工艺要求相对较高;对于浸没冷却,由于服务器整体架构改动较大,若能够流水线批量生产对应设备,则工艺成本可显著降低。因此,从加工成本的角度进行对比,喷淋冷却的优势相对更加明显。
3) 从改造成本的角度进行对比,用于传统数据中心的改造时,冷板冷却对于服务器整体架构改动幅度最小,可以保留服务器原有架构,喷淋冷却次之,但需要额外进行密封处理,防止冷却液散溢或泄漏,而浸没冷却对服务器架构改动最为明显,较难适应服务器原有框架。因此,从改造成本的角度进行对比,冷板冷却的优势相对更加明显。
4) 从运维成本的角度进行对比,3种液冷技术的运维难度相较于传统风冷技术都较为简单,运维难度主要在于生产厂商液冷设备的技术成熟度,施工过程中液冷设备的组合安装以及使用阶段液冷设备的检测调控等。目前,冷板冷却技术发展最为成熟,浸没冷却技术次之,喷淋冷却技术处于起步阶段。上述结论均适用于单相液冷技术,目前相变液冷技术的运维难度相对较高,系统整体复杂度呈量级提升。另外,可以从空间利用率、能源利用率等角度进行对比。
总体而言,3种液冷技术各有优缺点,需要根据数据中心自身特点择优确定液冷方案。需要说明的是,上述对比都是基于当前数据中心液冷技术现状的,若后续相应材料成本、加工工艺和改造技术等有所突破,上述分析需要有所更正。
5 结束语
近年来,数据中心的发展呈蓬勃之势,与此同时,数据中心的能耗大幅上升,因此数据中心的节能减排势在必行。液冷技术经过研究人员的共同努力,逐渐从理论基础发展到实际应用,可有效解决数据中心内电子器件严苛的高热流密度散热要求。
目前液冷技术研究方向主要为优化传热结构、高效冷却液和两相沸腾换热等。优化传热结构,如阵列布置和微/纳表面结构,通过改变工质流动特性获得优异的传热性能,如何提高加工工艺的便捷性,成为其有效推广的关键问题之一。高效冷却液,如纳米流体和液态金属,具有优异的热物性并表现出极高的换热效果,如何降低其使用成本,成为其有效推广的关键问题之一。两相沸腾换热,利用冷却液的相变潜热,可明显强化换热强度并改善温度均匀性,如何提高两相液冷系统的可靠性与安全性,成为其有效推广的关键问题之一。
总体而言,数据中心的液冷技术处于起步阶段,仍有许多关键问题亟待解决。相较于基于风冷技术构建的数据中心,基于液冷技术构建的数据中心对其内部的布局、构架、设备等需求发生了明显的变化,势必重构数据中心的相关产业链,这对于我国来说是一个非常关键的时期,相关高校、企业和研究机构等应该集中力量,突破关键“卡脖子”技术,把握技术创新主动权,实现数据中心相关产业链的自主研发、自主生产、自主建造,并满足数据中心节能减排与低碳环保的需求,实现可持续绿色数据中心的高效运营,提升我国数据中心行业在国际上的核心竞争力。
来源:制冷与空调
本文标题:数据中心高效液冷技术研究现状
本文链接:https://www.blueocean-china.net/faq3/1013.html [版权声明]除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。