数据中心UPS供电系统可用性设计

作者:兰洋科技    浏览量:4193    时间:2023年05月04日    标签: UPS电源

UPS电源是工业领域用来对负载进行断电保护的关键设备。对于断电保护,针对不同的负载应用,又有两种类型。一种是普通的电脑类设备,当断电发生时,UPS电源需要为负载提供几分钟到十几分钟的后备供电时间。在这段后备时间之内,负载设备会进行数据存储等动作以防数据丢失,之后负载就会关机。在UPS达到后备时间之后负载仍然会断电,但这不会导致经济损失。另外一种是在数据中心,以及工业应用之类的场合,对UPS的要求就是真正的不断电,UPS系统必须提供整年每天24小时的连续供电。本文对可靠性与可用性的讨论就是针对这种情况。

数据中心UPS供电系统可用性设计

电源系统的可靠性通常可以使用MTBF(平均故障间隔时间,或者平均无故障工作时间,以小时表示)来表示,此外还有一个更加容易理解的指标AFR(年失效率)。AFR和MTBF成反比关系,也就是AFR=8760/MTBF。因此MTBF越长,则年失效率越低。

对于可维修的系统来说,还有一个可用性的指标,其定义是A=MTBF/(MTBF+MTTR)其中A是一个百分比指标,MTTR值得是平均故障修复时间。如果系统出现故障时可以非常快速的恢复,那么系统的可用性指标就比较高。对于电网这类对象来说,使用可用性指标可以更加直观的衡量其可靠程度。而对于在关键场合经常使用并联冗余配置来说,可用性指标比可靠性指标更具有现实意义。

可靠性/可用性指标都是统计意义上的概念,一个电源系统的可靠性/可用性与构成系统的各个模块的可靠性/可用性之间也存在统计意义上的关联。

假设电源系统中存在两个电源模块,而这两个模块是并联工作的,其中一个和另外一个是互相独立的。

那么考察这两个模块组合起来的系统的可用性Asys与每个模块各自的可用性A1与A2的关系就有Asys=1–(1–AFR1)×(1–AFR2)另外一种可能是系统中这两个模块是串联的。

那么这两个模块组合起来的系统的可用性Asys与每个模块各自的可靠性A1,A2的关系就有

Asys=A1×A2

由于可用性肯定是处于0~1之间的数值,因此两个并联模块的总体可用性要高于各自的可用性,而两个串联模块的可用性要低于各自的可用性。

UPS电源的可靠性

从单个UPS的设计来说,可以把整个产品按照模块进行划分。

从图中可以看到,UPS各个模块之间的依赖关系比较复杂,但是还是可以分出串并联的关系如下:

辅助电源与所有其他模块都是串联的,因此辅助电源的可用性直接限制了系统能够达到的最高可用性等级;

控制模块与除辅助电源之外的其他模块也都是串联的,因此控制模块的可用性也会直接影响到系统总体可用性设计;

对于负载端来说,能够直接相连的只有旁路模块与逆变模块,而这两个模块是并联的;

PFC/整流模块与电池升压模块是并联的,之后再与逆变模块串联;

从能源提供者来讲,这里旁路电源与市电电源是两路独立的电源,而电池能源是由市电经过充电模块提供的。如果充电模块故障的话电池就没有能量存储,实际上也无法实现正常的UPS功能,因此市电—充电模块—电池也是串联的。

从这一路径关系里可以看到,总共存在3条并联的路径,而每一条路径各自又是由数个模块串联起来的。正与前面分析的一样,辅助电源与控制模块的可用性是串联在所有通路上的,因此如果这两者设计有缺陷的话UPS的可用性是无法做的很高的。电池回路串联有最多的模块数量,也是可用性最低的一条路径。

要提升系统的可用性首先要提升关键路径的可用性。从路径图上可以看到就是控制模块与辅助电源。辅助电源是整个UPS的关键点,如果辅助电源不工作整个UPS都将瘫痪。提升辅助电源可用性的方式可以有很多种方案:一种是改进设计,提升MTBF;一种是对辅助电源也适用并联冗余设计,提升可用性;再一种是对UPS的三条可用性路径分别使用不同的辅助电源,相当于把原来完全串联的路径改成并联。在UPS设计中可以混合使用这几种方式,由于上面三条可用性通路是并联的,而旁路通路本身是可用性最高的一条,因此最为推荐的设计就是优先提升旁路的可用性,对旁路单独使用一套辅助电源供电,并且这套电源的尽量采用简单的设计,以拥有高的MTBF。

控制模块同样也是影响到所有路径的关键点,也必须拥有高的可用性。参照辅助电源的处理方法,也可以给相对独立的旁路路径配备单独的控制模块,并且通过与其余控制功能协调工作来达到高可用性的目的。同样,旁路上的控制模块也要尽量简单,以提升可靠性。一种推荐的做法是旁路控制模块不断的检测UPS主控制模块的状态,如果发现主控制模块,则自动切换到旁路方式。此外,对于主控制模块来说也可以通过冗余的方式来提升可用性,比如采用双MCU结构,当一个MCU检测到另外一个MCU发生故障时可以接管另一个MCU的功能,或者采取紧急措施如转旁路来保证负载不断电。

对于UPS来说,电池是保证UPS能够在市电或者旁路断电发生时继续维持供电的关键,但是串联环节最多,也恰恰是可用性最为薄弱的环节。一般电池规格书里面会说明充电电流不要超过0.15CC,这就意味着电池在UPS满载放电放完之后要用数倍的时间才能重新充满,从这个意义上讲其可用性一般都在20%以下。但是由于电池并不是连续工作的,只要在电池放完前市电恢复,在重新充电的过程中也没有再发生断电,那么负载仍然不会受到影响。从这方面来看,电池的可用性在只会发生短时间的断电情况下还是很高的。

再重新来审视电池回路的可靠性,在电池与市电之间还有一个充电器模块环节。如果充电器损坏则电池在一次放完电之后就无法再充回,导致下一次市电停电时负载断电。但是充电器只是在电池需要充电时才会工作,因此如果能够及时对充电器的状态进行监控,在发现充电器异常时及时报警,就能够避免充电器故障带来的问题,从而提升整个UPS的可用性。对于电池也有一样的手段。电池在使用多次之后也会面临容量下降和失效的问题,但是如果能够通过电池状态监控发现电池失效并及时更换,也能够有效提升UPS的可用性。

UPS系统的可靠性

由于UPS并非一个单独的应用系统,而是要搭配有其他一些环境因素在里面,所以这些外部因素也是必须考虑进来的。前面提到过,UPS电池的备电时间是有限的,如果断电时间比较长,导致电池电放完,那么负载就仍然会断电。因此UPS可用性会受到市电发生长时间断电概率的影响。

为了解决这一瓶颈,可以在UPS系统中加入一个特性和电池互补的备用电源:在市电断电时的不需要很快反应,但是在长时间停电条件下能够持续提供电力,燃油发电机组就是最为合适的一个选择。因此在UPS系统配置上可以加入一个自动切换装置,在市电停电后切换到发电机组。这样一来能够极大的提升长时间断电条件下UPS系统的可用性。

虽然在可用性路径里面多串联了一个市电与发电机切换用的ATS,增加了单调路径发生故障的概率,但是相对长时间断电带来的可用性问题来说还是值得的。

在UPS应用的另外一个分支是目前正在兴起的直流UPS系统。直流系统的思路是出于提高效率的目的,减少电源系统中间的转换环节,电力分配部分由原来的交流转换成直流。

可以看出,理想的直流UPS系统由于把交流系统中UPS的逆变环节与服务器电源中的PFC环节使用一个隔离型DC/DC环节来取代,从而可以改善效率。不过在直流UPS系统里面由于电池电压的变动范围是比较大的,为了取得更优化的效率曲线,在后级的服务器电源中也有可能使用两级结构。也就是通过一个简单的转换,减小服务器电源隔离DC/DC转换级的输入范围,以得到更好的节能效果。

在这种直流UPS体系里面,不存在交流UPS中的旁路回路了,只存在一个市电到电池回路,这个回路也兼有充电器的作用。因此从单个UPS的可用靠性角度考虑,直流UPS可靠性链路只有两条,其中一条是两级变换加上辅助电源与控制板,另外一条是电池。

与交流UPS相比,直流UPS供电少了交流UPS的旁路回路,少了一个提升可用性的回路。但是电池是直接给负载供电的,可用性要高于交流UPS。因此在可用性的方面直流供电系统有得有失。但是另一个方面直流系统比交流UPS更容易进行并联,从而可以利用增加并联台数的方式增加可用性。

配电系统的可用性

对于一般的UPS系统应用来说,存在两种常见的配置方式,一种是双机热备份。

在正常情况下由UPS1供电,如果UPS1的逆变/整流部分损坏,则仍然有UPS2可以供电。第二种配置方式是双机并联冗余。

这种配置方式下两台UPS是完全并联工作的。基于前面可用性的原理,第二种配置方式比第一种会有更高的可用性。

这里就反映了可用性与可靠性的一个明显不同。对于两台并联冗余配置的UPS,由于器件多了一倍,那么出现故障的概率也会增高,因此从统计意义上来讲整个系统的MTBF会下降。但是由于其中一台出现故障之后仍然有一台在工作,只要出故障的UPS能够很快修复,负载就仍然处在有效的保护之中,可用性是提升的。从负载的角度衡量,评估系统的可用性比可靠性更加有意义。

在可用性的定义中,电源系统恢复的时间越短,则可用性也会越好。因此把电源系统设计为模块化易更换的结构,可以大大减小维护时间,从而使得可用性显著改善。

对于机房应用的场合,双总线的概念应用十分广泛。对于关键的服务器负载,一般都提供两组电源输入。相应的,在配电部分就也可以对应采用两组独立的电源总线。结合UPS本身就支持双总线输入,实际上可以构造出很多种组合形式。对不同方式进行比较后。

这里把两组独立市电都供给两套UPS系统,然后每一套UPS系统作为一条总线来使用,可以充分发挥市电双总线,UPS内部双总线以及负载双总线高可用性的优势。

结论

本文对UPS内部设计,UPS系统以及配电系统的可用性进行分析,给出了提升UPS电源系统可用性的思路。通过分析结果可以发现在UPS中采用旁路与市电独立的电源,加入多CPU监控,加入电池监控等措施可以明显提升UPS的可用性。另外一方面在系统层次上,选择模块化的结构,缩短维修更换时间,更多使用并联结构,也可以明显提升可用性。

本文标题:数据中心UPS供电系统可用性设计

本文链接:https://www.blueocean-china.net/faq3/407.html
[版权声明]除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。

全国统一服务热线
15336679905
Copyright ©2019-2023 兰洋(宁波)科技有限公司 版权所有
ICP备案:浙ICP备2021021247号