1引言
随着大数据、人工智能等技术的蓬勃发展,数据中心承载业务对算力的需求不断提高,进而导致数据中心规模不断扩大、单机架功率持续提升。数据中心规模的扩大和单机架功率的提升使数据中心能耗不断增长,居高不下的能耗不仅给企业带来了沉重的成本支出,也对社会能源、资源造成了极大的消耗。与此同时,数据中心单机功率密度的提升使得数据中心热量集聚问题愈发凸显,传统风冷制冷方式散热能力不足的缺陷逐渐暴露出来,成为影响单机架功率密度提升的主要因素。
当前,我国正处于数字化转型的关键时期,各行业对数据中心算力的需求将保持高速增长,单机架功率密度预期仍将进一步提升;而数据中心的绿色发展也受到了社会的格外关注。因此,必须创新数据中心制冷方式以应对挑战。作为一项全新的革命性“产物”,液冷技术的兴起,全面改变了数据中心基础设施建设。而冷板式液冷以其技术成熟、方便易用的特性,广受业界关注。本文主要对冷板式液冷技术发展与应用现状进行了分析,以期更好明晰产业发展动向。
2液冷及冷板式液冷技术发展历程
20世纪60年代,IBM推出了采用液冷系统的System/360型91大型计算机,这款产品以高速度和高性能优势被广泛运用。但在很长的一段时间内,液冷技术并没有得到有效的发展,主要原因是早期数据中心规模小、机架功率密度低,对液冷的需求并不强烈。其次,与风冷技术相比,液冷技术在系统部署、制冷原理以及技术方向等方面存在较大的研发及应用困难。因此,在很长一段时间内,数据中心液冷技术发展缓慢,数据中心制冷仍然以风冷为主。而近年来,随着互联网、人工智能、大数据等应用的不断创新和发展,不但快速推动了数据中心应用场景的变革,而且也加快了底层技术如液冷等的发展步伐。
按照是否与发热的器件产生直接接触的形式,将液冷技术分为接触和非接触式两种类型。接触式液冷中冷却液与发热器件可直接接触,接触式液冷技术的具体实现方案主要包括浸没式和喷淋式液冷,非接触式液冷技术的典型方案是冷板式液冷。浸没式液冷往往需要对IT设备进行定制化改造和设计,对机房现有IT基础设施改造幅度较大,技术难度较高。喷淋式液冷通过在机箱顶部储液和开孔方式让冷却液对发热体进行喷淋,喷淋式液冷对机箱改造幅度较小,但是在制冷过程中可能会产生冷却液遇高温飘逸和蒸发现象,这些雾滴经机箱孔洞散发到机箱外后可能会降低机房清洁度,并对机房内其他设备造成影响,而冷板式液冷技术对服务器的改造幅度也相对较小,且安全性较高。
上述三种液冷技术方案中,冷板式液冷技术是应用最早、普及率最高的液冷制冷方式,其可操作性和市场的成熟度也相对较高。国内外在研究冷板式的应用上具有较多的实践案例,其中IBM的SuperMUC则充分利用了冷板式的制冷特点,该超算中心水冷系统具有3072个温水水冷计算节点,共计86016个计算内核。由于德国常年气温都低于35度,超算中心实现了全年自然冷却的效果,为业界的绿色HPC系统标杆。如今德国慕尼黑部署超算中心(LRZ)在SuperMUC-NG集群上运行了750个应用程序,2000多名科学家可通过自助模式随时访问HPC资源。
与国外相比,我国的数据中心发展相对较晚,初期发展过程中对数据中心的能耗方面重视较低,大部分数据中心PUE(PowerUsageEffectiveness)保持在2.2~3.0之间。近年来,不少数据中心都积极尝试包括冷板式液冷在内的新技术。2015年,中科院使用冷板式液冷服务器建设了“地球系统数值模拟装置原型系统”,通过大量的实验测试,不但有效降低了PUE的值,而且也大幅度降低了能源消耗,在一定程度上提升了计算性能。
总体来看,液冷技术的应用使得数据中心的PUE值得到改善,而且能效水平得到了明显的提升。目前,国内外在冷板式液冷方面,均进行了较多的尝试,并取得了较好的进展。国内以华为的全液冷系统为例,其利用液冷技术,较好的实现了IT设备的高密度部署,提高数据中心能源使用效率。
3冷板式液冷技术分析
当前,冷板式、喷淋式以及浸没式等类型,属于业界典型的液冷技术。本文主要以冷板式液冷技术为主要研究内容,本章对冷板式液冷系统设计、优势及现存问题进行介绍。
3.1冷板式液冷系统设计
冷板式液冷主要通过冷板(铜、铝等高导热金属构成的封闭腔体)将元器件的热量间接传递给封闭在循环管道中的冷却液体,然后利用冷却液体将热量带走,其通过工作流体的传递特点将中间热量运输到后端进行冷却。液冷主要的循环过程,如图1所示。首先,在机柜上设置分水器;其次,对接进出水管路提供给计算节点的进出口,以节点内的冷板管为媒介,完成液体的循环;最后,将CDU与外部管路连接的接头连接,完成液冷循环。
如图2、图3所示,在冷板式液冷的设计过程中,主要由一次侧与二次侧的相关设备构成,一次侧通过冷却液体与发热部件的热量进行相互交换的方式降低冷却液的温度;二次侧完成发热部件与冷却液体热量的交换,液体升温带走部件热量。通过一次侧和二次侧的结合实现了冷板式液冷系统的整机液体循环,进而成为IT设备散热的目标。
数据中心的可用性一直以来都受到业内的主要关注,冗余设备及部件的应用,将会有效提高数据中心可用性。在使用冷板式液冷的过程中,为了保障整个系统一次侧和二次侧有较高的可用性,则应对关键设施进行冗余装配,具体情况如下:
(1) 一次侧设备冗余:主要由室外机等设备组成,通常情况下,采用N+1冗余已经可以较好的实现日常维护并应对突发事件;
(2) 二次侧设备冗余:关键设备为冷却液分配单元(CDU),一般可以根据系统的规模、以及对安全性的要求进行设备的冗余配置,若对大规模的系统要求较高的安全系数,采用不低于N+1冗余配置的应用较为合适;
(3) 液体管路冗余:从管路的可靠性,以及设备的经济性和易用性等角度出发,一般冷板式液冷的液体管路可以按照无冗余的方式进行配置。
3.2冷板式液冷的优势
为了提高数据中心的散热效率,产业界做了大量尝试,但相关技术均存在一定的局限性,而冷板式液冷技术在应用方面,具有以下优势:
(1) 材料兼容性好。冷板式液冷技术在冷却液管路中流动时,并未与主板和芯片模块进行直接的接触,材料兼容性较强。而且在选择冷却液时,可只考虑冷却液与循环管路以及冷板之间的兼容性问题;
(2) 对发热器件的要求较低,安装较为简捷。冷板式技术不改变服务器主板原有的形态,而是在保留现有服务器主板时,对其进行改装实现。这种改装方式不仅拆卸简单、安装方便,而且在技术、产业以及规模化生产上具有更好的可行性;
(3) 成本较低,应用发展快。高昂的水冷机组极大的提高了数据中心建设的总体成本,而冷板式液冷技术的应用替代了高成本的水冷机组,有效的降低了总成本的消耗量。采用冷板式液冷技术不但可以有效提高数据中心的能源利用率,而且在适应数据中心的高密度需求方面也较为符合;
(4) 高密度、高效能、高可靠。采用冷板式液冷系统后,可以实现机架功率密度的提高,有效提升单机架的计算能力;冷板式液冷系统相对风冷在能效方面,也将具备高效能的特点。同时,相对于风冷,在产业界进一步对液体、管理和设备冗余进行更为合理的设计和应用后,液冷也将具有比风冷更高的可靠性。
3.3冷板式液冷现存问题
目前,冷板式液冷技术发展中面临一些困难。
3.3.1需要解决机房适配问题
冷板式液冷方式的部署环境与传统的机房管路配置相比不但具有很大的差异性,而且在部署传统机房的液冷系统时会消耗较大的部署成本。包括转接头之类的部件兼容性也是机房适配需要考虑的问题。
3.3.2相关标准需进一步完善
目前,基于开放数据中心委员会(ODCC)的研究成果,中国通信标准化协会发布了系列液冷团体标准。这些标准可以进行框架性指导,但需要更加细节性的技术规范对冷板式液冷部署和液体相关进行标准化规范管理,为后续大规模部署奠定良好基础。
3.3.3急需专项资金支持
液冷技术是一项成本耗费巨大的工程项目,不但需要具有优秀的服务器研发能力,同时还需要具备相关流体方面的技术实力,还需要机房风火水电等基础设施的整体配合,投入较大、见效较慢,如有相关专项资金的支持将会提升该技术的应用进度。
4冷板式液冷应用实践
为了实现冷板式液冷系统的稳定运行,冷板式液冷必须在相关技术方面取得突破,本文对冷板式液冷的技术及业界具体实践进行了分析。
4.1液冷与风冷的结合应用
冷板式液冷通过设备内部的管路,实现了将大功耗部件产生热量,使用液体冷却介质带走的目的。通常情况下,设备内部热量较少的器件,仍将采用风冷的形式进行散热,如硬盘、接口卡等设备。因此,与采用风冷的散热形式相比,液冷与风冷的结合有效降低了损耗的效率,成为业内典型的应用模式。如图4所示,为目前业界采用的方案之一,其直接液冷部分采用冷板的形式,为大功率发热部件;其间接液冷部分,通过换热器,实现风冷系统的热风与一次侧冷却液体的热量交换,从而利用冷却液体将热量带出机房。液冷与风冷的结合,不但可以通过利用液体冷却的技术进行高效率的散热;而且也可以采用风冷的形式,为发热功率较低的部件进行散热,也降低了系统的设计和使用难度,并有利于在总体上实现效果、成本的最优,也有利于系统更为灵活的应用。
4.2水质监控技术应用
冷却液是液冷系统进行热量交换的主要媒介,因此,如何挑选合适的冷却液成为众多企业研究的主要目标。应用层面,选取冷却液应当考虑环保、稳定、经济以及电化学反映等因素;另一方面,也要采用技术手段,监测水质等情况,以进行响应的预防和处理。当前,冷板式液冷的冷却液包括乙二醇、水等,在水质监测方面,包括pH值、液体浓度、微生物总数等指标,冰点仪、pH计以及折光仪等成为监测所采用的设备或者方法。
4.3热回收技术应用
数据中心的余热利用是企业长期关注的重点研究内容,不但可以大幅度提高能源的利用效率,而且也稳定了系统的可靠性能。当前的制冷设备无法直接吸收数据中心的低品位余热,而液冷冷板式散热器在降低消耗额外电能的情况下,可直接吸收低品位余热。液冷散热的运行水温具有长期不变的特点,因此与其他的机组相比,液冷散热的节能效果极为显著,不但在吸收冷凝热方面具有较大的优势,而且具有较高的综合能效比。
5结束语
在数字经济高速发展的时代,数据中心规模的不断扩大、单机架功率密度快速提升,对数据中心制冷和能耗带来了前所未有的挑战,多数企业已经意识到建立低能耗、高制冷效率以及高节能数据中心的重要性。
在数据中心的建设与运营过程中,液冷数据中心虽具有架构简单、低能耗的特点,但处于初步发展阶段的液冷技术,在设备研发、冷却液稳定性、运维等方面,还有诸多问题急需解决。冷板式液冷技术作为液冷技术重要的实现方式之一,目前已经逐步开始在产业界进行应用。针对冷板式液冷技术,本文从技术和应用两方面进行了分析。未来,冷板式液冷技术除了其本身的演进外,也必将对机房、供配电、IT设备等产生巨大的影响。业界应当高度关注液冷技术的变革,并研究其对数据中心建设的影响,进而推动技术的应用,实现高效能数据中心的建设。
来源:网络
本文标题:冷板式液冷技术与应用现状分析
本文链接:https://www.blueocean-china.net/faq3/214.html [版权声明]除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。