00引言
数据中心是支撑现代经济社会发展的战略资源和新型基础设施,用于收集、存储、处理和分发大量数据。随着人工智能、虚拟现实、智慧城市等高密度业务应用的逐步发展,数据中心所需应对的计算量和计算复杂度迅速增长。在芯片制程提升速度变慢的限制下,为了满足更快更难的处理要求,计算行业不得不通过“堆料”方式提升芯片能力,CPU功率已从单个150W增加到300W以上,用于图形处理单元的GPU单个功率甚至超过700W。对于信息通信设备而言,运行温度是严重影响其工作性能稳定的重要因素,数据中心散热必须随着密度升高得到有效解决。根据冷却原理不同,目前的冷却解决方案可以分为气体冷却(风冷)和液体冷却两大类。由于风冷散热架构下数据中心机架的最大功率在20~30kW,而直接液体冷却可以将每个机架的功率限制提高到100kW以上,因此在越来越多的热负荷高、建筑面积有限、节能要求高的场景下,只能寻求液体冷却解决方案。
随着我国数据中心政策对PUE要求的收紧和对节能低碳的推崇,降低能耗成为数据中心必须探索的课题。数据中心运行所需能耗至少1/3用于IT设备散热,因此降低制冷系统能耗是整个数据中心节能降耗的关键环节。液冷散热技术通过液体循环换热提高冷却效率,可以显著降低数据中心的总能源消耗和二氧化碳排放,契合我国数据中心低碳发展要求。
数据中心液冷分为浸没、冷板等主要方式,浸没式冷却方式由于散热效率较高、可以极大降低PUE,近年来得到专家学者及行业用户的重点研究,是数据中心液冷技术的关键分支。据统计,全球浸没式液冷市场预计将在未来五年增长至7亿美元,年复合增长率超20%。不断增加的芯片密度,苛刻的边缘计算环境等新场景,以及数据中心节能减排的压力,或将持续推动浸没式液冷市场壮大。
01.浸没液冷冷却方式
浸没式液冷是典型的直接接触式液冷,电子设备被浸入冷却液中,产生的热量直接转移到冷却液,并依靠液体的循环进行热传导。目前,我国浸没式液冷已进入商用部署阶段,阿里巴巴在其电力容量2MW、可容纳数千台服务器的冬奥云数据中心,规模化部署了单相浸没液冷服务器集群,开启了液冷的正式商用,又在余杭打造了全浸没式云计算仁和数据中心,是我国首个绿色等级达5A级的液冷数据中心。
1.1单相浸没液冷
根据所使用的冷却液在冷却电子器件的过程中是否会发生状态改变,可将浸没式液冷分为单相浸没液冷和相变浸没液冷两类。单相浸没式通过在整个系统中循环冷却液来消除设备产生的热量,首先热量从电子设备传递到液体中,然后使用循环泵将带有热量的冷却液送到热交换器,在热交换器中与温水进行循环换热,以持续地为设备部件降温。单相液冷中冷却液挥发控制相对简单,密封性良好情况下冷却液损失较小,无需频繁补充冷却液。
图1单相液冷系统原理图
1.2相变浸没液冷
相变浸没液冷将系统中的电子设备浸入盛有易挥发冷却液的容器中,冷却液沸点较低,在环境热量达到一定条件时,会利用潜热吸收热量并产生沸腾相变,从而为设备降温,冷却液蒸汽再被冷凝管冷凝变为液态,回到液冷槽内循环换热。
相变浸没液冷可以满足更高的服务器功率密度,去除风扇噪音,并减少制冷设备的占地面积,消除了对风冷基础设施的需要,简化了制冷设施的建设。然而,相变过程中压力会发生变化,对冷却液蒸发损失的控制相对复杂,冷却液容易受到污染物影响,一旦发生泄漏不容易修复。该技术需要根据冷却液的工作特性来调整设计,相较于单相浸没液冷对于数据中心的施工难度和成本有所增加。
图2两相液冷系统原理图
02.典型浸没液冷冷却液
无论是单相还是相变式浸没液冷,其核心制冷要素是将带电状态下的完整服务器或其组件浸没在冷却液中,因此充当换热介质的冷却液必须是导热能力强但不导电(或具有足够低导电性)的介电液体,这样的介电液体通常不溶(或难溶)于水及其它离子性介质,可最大限度保障其绝缘性不被轻易破坏。同时,其本身在气味、毒性、降解难易、可维护性等方面特性对环境和操作人员应尽可能友好。基于以上考虑,目前在浸没液冷领域应用讨论最广泛的冷却液主要分为碳氢及有机硅化合物类和碳氟化合物类。
2.1碳氢及有机硅类冷却液
碳氢化合物(Hydrocarbon)冷却液和有机硅类冷却液一样,常温下呈黏稠状,因此这一类被业内统称为“油类冷却液”,在数据中心液冷应用之前,工业上常用作变压器冷却剂。它们普遍具有沸点高不易挥发、不腐蚀金属、环境友好、毒性低等共性,且成本较低;但由于具有闪点,油类冷却剂使用中有可燃助燃风险。常见的油类冷却液可以分为天然矿物油、合成油、有机硅油3大类。
天然矿物油从石油中蒸馏而来,并可能经过深度氢化处理,成本较低,在室外变压器冷却场景中应用悠久。但在使用中难以避免烃类分子的分解氧化,会造成酸性增强和污染物产生,影响冷却液特性甚至导致被冷却器件的腐蚀。合成油是在人工合成的烷烃类或酯类化合物的基础上加入添加剂制成的,常见冷却剂类型有聚α烯烃(PolyAlphaOlefins,PAO)、天然气合成油(GastoLiquidBaseOil,GTL)、合成酯等。合成油的生成工艺更加精细,杂质含量、抗氧化性、材料兼容性与矿物油相比有较大改善,但是作为碳氢类通病的闪点问题依然存在。有机硅油主要依赖人工合成,可以设计出高闪点的产品,但其闪点同样与粘度正相关,可燃风险降低的同时导致了流动困难,设计时需协调好两者之间平衡。另外,硅油还可能发生水解和氧化沉积影响接触性能等问题。
2.2碳氟类冷却液
碳氟化合物(Fluorocarbon)是将碳氢化合物中所含的一部分或全部氢换为氟而得到的一类有机化合物,普遍具有良好的综合传热性能,可以实现无闪点不可燃。同时,由于C-F键能较大,碳氟化合物惰性较强,不易与其它物质反应,是良好的兼容材料。根据碳氟化合物的组成成分和结构不同,可再分为氯氟烃(Chlorofluorocarbons,CFC)、氢代氯氟烃(Hydrochlorofluorocarbon,HCFC)、氢氟烃(Hydrofluorocarbon,HFC)、全氟碳化合物(Perfluorocarbon,PFC)、氢氟醚(Hydrofluoroether,HFE)等种类。
其中,CFC和HCFC问世较早,是20世纪广泛被应用的制冷剂,但因为对大气环境尤其是臭氧层的破坏性,这两类已在《蒙特利尔议定书》中被认定为禁止使用的制冷剂。HFC最常见的应用是家用冰箱和空调中的R410A制冷剂,其没有臭氧层破坏作用,但会带来温室效应。PFC包含全氟烷烃(Perflroroalkane)、全氟胺(Perfluoroamine)、全氟聚醚(Perfluoropolyethers,PFPE)等类型,在沸点和介电常数方面的特性较为适合半导体设备冷却场景,其应用历史可以追溯到半个世纪前的大型机时代,和HFC一样在导致温室效应方面的缺陷较大。HFE的温室效应影响较小,对臭氧层无破坏,但通常具有较高的介电常数,和PCB微带线或连接件直接接触时对信号传输影响较大。
面向愈发严格的环境保护要求,氟化学公司正致力于研究开发超低温室效应碳氟化合物(UltraLowGWP),争取对环境友好的同时兼顾商用需求、适宜的生产成本和稳定工艺,3M电子氟化液、兰洋科技导热液、科慕、霍尼韦尔等企业均有所涉猎。
2.3应用场景差异
对于单相浸没液冷,碳氢及有机硅类化合物和碳氟类化合物均可作为冷却液,为确保冷却液在升温状态下始终处于液相状态,减少挥发,必须选择有较高沸点的液体介质。同时,在使用中需尽可能选择粘度值低的冷却液,以增加流动性和减少对泵的压力,形成良好的系统内循环。而相变浸没式液冷通常会选用较低沸点、适宜沸程的碳氟冷却液,以便于吸热汽化和散热液化循环。因大多数碳氢和有机硅化合物具有闪点,均可燃或易燃,所以通常不用于相变浸没式液冷系统,仅用于单相应用。
实际浸没液冷系统设计确定冷却液时的考虑因素包括:热物理性能、长期稳定和清洁度、材料兼容性、对传输信号影响、易燃性或可燃性、安全性、环境影响、可维护程度,以及一次投入及后期运行的总体成本等,后续章节将就其中的重点问题进一步剖析。
03.冷却液的关键性能
3.1热物理性能
冷却液的热物理性能,是决定数据中心浸没液冷系统散热效果的直接因素。在热对流的传热方式下,物质密度与比热容的乘积越大,则其单位体积携带热量的能力越强,散热效率也就越高,即冷却液的密度、比热容,以及更直接的导热率指标均与其传热性能密切相关。此外,粘度是衡量流体在驱动力作用下流动的内部阻力指标,冷却液粘度决定了其在进行流动传热时的效率和难度,相对较低的液体粘度也是传热液体所需的。碳氟类冷却液的比热容和导热率比碳氢及有机硅类冷却液稍低,但其粘度远低于对应的碳氢及有机硅类冷却液,所以整体传热能力相同甚至更佳。
除基本性能外,沸点和汽化潜热同样是冷却液重要的热物理性能指标。单相液冷中,需选用高沸点的冷却液,使得制冷过程中液体始终保持液态。相变液冷中,通常选用常压下沸点在60℃以下且沸程窄的冷却液,以满足对电子器件在其理想工作温度进行冷却的要求。同时,冷却液沸点不宜过低,以免气体冷凝困难,冷却系统不能形成有效循环。沸程窄可使冷却液汽化速度快,设备热表面的温度梯度小,传热速率更高。汽化潜热是指在不改变温度的情况下将单位质量的液体转化为蒸汽所需的热量,冷却液的汽化潜热越大,液体相变换热的效率越高。
总而言之,高液体密度、高比热容和高汽化潜热可减少消除定热负荷所需的液体体积流量,高导热率、低粘度和适宜沸点可提高传热能力和效率。由于影响冷却液散热效果的热物理性能参数较多,进行冷却液选择时,应针对具体场景和整体液冷系统设计,通过具体测试对比分析和筛选。
3.2材料兼容性和可靠性
因浸没液体冷却方式中,冷却液与电子元件直接接触,因此制冷过程中冷却液材料兼容性的好坏决定了液冷系统的可实施性、维护成本和使用年限。按照浸没液体对不同环节或对象的兼容影响差异,可以分为材料兼容性和信号兼容性两大方面。
材料兼容性方面,主要指冷却液是否与被冷却的IT设备或组件发生反应或产生溶解萃取等影响。碳氟类冷却液具有化学惰性,尤其不易与金属、无机物质反应,全氟聚醚(Perfluoropolyethers,PFPE)等全氟化合物均是非常稳定的介质,具有极高材料兼容性。碳氢类冷却液的兼容性相对较弱,特别是矿物油等天然油;但通过不断改良或提炼的合成油已在兼容性方面有较大突破,如PAO、GTL等。冷却液的兼容性需要通过实测来进行评估,通常采用KB(Kauri-Butanol)值作为初步评判指标,KB值越高意味着冷却液对有机类材料的溶解能力越强。此外,还需特别注意部分风冷下工作的组件在液体环境的兼容问题,例如传统机械硬盘HDD无法直接在冷却液下工作,需选用借助镭射封装等技术将HDD密封在氦气环境下的氦气硬盘;固态硬盘SSD则基本不存在与液体的兼容性问题,可以直接应用。
信号兼容性主要指浸没液体对信号传输完整性的影响。在浸没液冷方式下,设备高频高速信号需要在与绝缘性冷却液接触的通道中进行通信传输,冷却液的介电常数等物性会对传输产生影响,衰减信号能量。介电常数反映的是电介质在施加外部电场时存储能量的相对能力,材料介电常数越小,对信号传输的抑制作用越低。特别是在当前数据中心信号传输从16Gbit/s到32Gbit/s甚至未来的112Gbit/s迈进过程中,冷却系统所面临的设计要求会越来越高,需审慎选择对信号传输影响小的冷却介质。当前在实际应用中通常选择在信号工作频率介电常数较小(≤2)的冷却液。
3.3总体拥有成本
冷却液的总体拥有成本分为初始成本和运营成本两大部分,初始成本是指浸没液冷系统组建时购置液体产生的成本,而运营成本则是指浸没液冷系统运行中因液体使用后需增补或更换液体而产生的成本。初始成本方面,矿物油等天然碳氢类冷却液单价相对低廉;人工合成油如酯类、烃类、有机硅类冷却液价格次之,大约在矿物油单价的2倍;碳氟类冷却液造价相对昂贵且比重较大,每升单价能达到合成油单价的5~10倍。当然,使用不同配置不同种类的液冷系统,其液体需求总量是不完全相同的,业内常用L/kW(IT负载)的度量单位进行需求推算。
运营成本方面,主要包含液体损失增补液体或寿命结束更换液体两部分费用。增补液体上,液体损失会由于蒸发损失和拖带损失构成。油类冷却液一般选用沸点较高的品类,蒸发量相对较低,蒸发损失相应较小,但因粘度更高,更换设备时附着在设备上的拖带损失也更多。碳氟类冷却液通常更具挥发性,蒸发损失相对较高,因此对液冷系统密封要求较高,但其粘度较低,更换设备时拖带损失较小。更换液体上,主要需考虑液体使用寿命问题,总体而言碳氟类冷却液寿命高于碳氢和有机硅冷却液。具体来看,矿物油等天然油由于杂质较多,保质寿命通常在5年以下。而维护良好不考虑其它风险因素下,合成油使用寿命最高可以达到10年,碳氟类冷却液则可以远超20年。
04.冷却液的安全和环境影响
全球范围内浸没液冷技术在数据中心的快速兴起促进了冷却液的研发应用,但使用过程中的安全和环境影响不可忽视。从长远应用来看,数据中心在布局液冷系统时,不仅要依据散热效果,同时要基于对操作安全和环境的考虑,谨慎选择冷却液的种类。
4.1冷却液的安全影响
在选择冷却液时,首先要注意操作人员安全健康方面的问题。冷却液的安全性主要包括对人体毒性和液体可燃性两个方面。在正常、处理得当操作下,职业接触评估完备的碳氢及有机硅类和碳氟类冷却液均对人体健康危害较小。大多数制造商建议在使用液体时佩戴丁腈手套,以避免接触皮肤和污染液体。从数据中心运营商角度,不同冷却液的安全特性不同,在室内使用时需要根据具体情况布置额外的安全措施,如编写操作手册、建立危险应急制度等。
碳氢及有机硅类冷却液不具有很强的刺激性气味,吸入性危害小,但大都具有闪点,有易燃易爆的不稳定性,在数据中心建设中应专门部署监控系统进行防范。美国供暖制冷与空调工程师学会(ASHRAE)发布标准34规定碳氟类冷却液作为制冷剂的安全分级,如图3所示,根据特定条件下的可燃性分为A1、A2L、A2、A3四级,而毒性A类和B类分别表示具有低毒性和高毒性。同时,这一标准还规定了空气中的最大制冷剂浓度限制(RefrigerantConcentrationLimit,RCL),以避免接触人员发生窒息、中毒等情况。
图3制冷剂安全分级
实际使用时,为防范冷却剂危害使用者健康,可从化学品安全技术说明书(MaterialSafetyDataSheet,MSDS)中查询基本理化特性。MSDS中包含了化学品的组成信息、理化特性、操作处置与储存、泄漏应急处理、废弃处理等关键信息,并且随着要求的升级按期更新。在我国,MSDS的编写和内容顺序遵循GBT16483标准,为应用中的操作准则和健康隐患提供了参考。
4.2冷却液的环境影响
数据中心的绿色低碳发展已成为行业共识,因此冷却液对环境的影响是重要的评判要求。一般选用臭氧消耗潜值(OzoneDepletionPotential,ODP)、全球变暖潜值(GlobalWarmingPotential,GWP)以及对土壤和地下水的污染等来衡量冷却液的环境影响。
ODP描述物质对平流层臭氧的破坏能力,GWP用于表示物质对全球气候变暖影响的大小。ODP值和GWP值越小,表示冷却液对环境的负面影响越小,碳氢和有机硅类冷却液ODP和GWP均非常低,碳氟类冷却液环境影响问题更突出。在全球范围对环保的重视下,ODP较高的碳氟冷却液已被淘汰,当前使用的大多数产品的ODP为零。GWP的指标则各不相同,例如PFC的稳定性强,在大气中的存在寿命较长,GWP值达到上千,而HFE具有较低的GWP值,在几百范围内。碳氟类液体应始终用于密封系统,以确保尽量少地释放到大气中。
对土壤和地下水的污染方面,碳氢和有机硅类冷却液蒸发能力低,如大量泄漏,会造成土壤或地下水污染。尽管大多数合成油被归为可生物降解类,但泄漏物也需及时控制和清理。在报废时,无论何种冷却液都应进行处理或回收,严格按照当地环境法律法规、管理义务和MSDS中的指导方针进行处置。
欧盟一些国家政府为减少高GWP氟化液的消耗,采取了如GWP加权税、特定应用的GWP限制等措施。欧盟法规规定,对含有氟化液体的设备应进行定期泄漏检查,以防止其释放到大气中,GWP值较高的液体需要进行更频繁的泄漏检查。因此,从降低后期维护难度来看,数据中心应优先选用不需要或仅需要最低限度的监管限制(环境友好、无环境毒害、可生物降解等)的冷却液。
05.发展与展望
材料兼容性与可靠性是浸没液体应用推广需考虑的最基本问题。各类子系统和组件构成了浸没液冷系统平稳可靠运行的重要基础,而冷却液作为热传递的主要工具,几乎与系统内的所有材料接触。某些冷却液可能会促进材料腐蚀或发生生物污染,从而导致冷却系统阻抗或故障;另一些冷却液,可能因介电常数的不适宜造成系统内信号传输的极大干扰,影响设备正常运行。因此,必须全面考虑每个系统组件与冷却液的相互作用,在设计和规范期间对材料相互作用和依赖关系进行详细分析,通过详细测试加强评估化学相容性、潜在的渗透或扩散损失等可靠性和性能风险。
在数据中心低碳发展战略下,冷却液的环境友好性值得重视。液冷技术有助于数据中心提高制冷效率、降低能耗,但使用冷却液造成的全球环境问题同样不可小觑。部分冷却液的使用会破坏大气臭氧层,并加剧温室效应,若发生泄漏,还可能导致严重的生态问题。因此,在冷却液的生产、储存、运输、使用、报废处理等各环节中要严格遵守相关操作指南和法律法规,确保对环境的影响友好且可控。绿水青山就是金山银山,数据中心在发展的同时应不忘保护地球生态系统和人类生存环境。
面对不断创新和增多的液体产品,生态完善和标准化是行业必经之路。浸没式液冷的应用推广,极大推动了冷却液产业发展,市场上五花八门的冷却液产品层出不穷。在传统数据中心向液冷数据中心的转型路上,若缺少可借鉴的成熟经验、完善的标准制度,盲目应用会造成大量人力和财力浪费甚至安全性问题。为推动液冷技术的规模化部署,确保成熟可靠的冷却液研发和应用,需建立完善的从技术研究到商业落地的全生态,目前我国开放数据中心委员会等组织正在积极开展相关工作。由产业凝聚共识、形成标准规范,数据中心液冷技术才能进入大规模商用加速道。
06结束语
散热能力和效率对数据中心尤为重要,高密度的发展趋势和电力、空间和环境的资源制约显著推动了冷却技术的发展。不可否认,浸没液冷是一种非常有效且相对安全的冷却方式,但对于当今整体功率密度还相对较低的数据中心而言,浸没液冷存在“杀鸡焉用牛刀”的应用困境,这是其暂时未能大规模推广的重要原因。同时,除了提供超高散热能力外,因为液体的特殊性还有一些因素亦使浸没液冷的应用普及面临挑战,如经济成本、材料兼容、泄漏风险、机房承重等。
总体而言,对于浸没液冷在数据中心的推广和使用不应一蹴而就,需耐心等待5G等新一代信息技术带来的创新应用孵化,助推数据中心功率密度提升,使浸没液冷应用的迫切性更突出。同时,还需培育完善的生态来应对产业发展中面临的诸如成本高昂等制约因素,冷却液及其它相关标准仍是需要研究的重点。
原文标题:数据中心浸没液冷中冷却液关键问题研究查看原文
本文来源:网络 版权归原作者所有,转载仅供学习交流,如需删除请联系我们,谢谢
本文标题:一文读懂浸没式液冷中冷却液关键问题
本文链接:https://www.blueocean-china.net/faq1/207.html [版权声明]除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。