一个典型的数据中心供电系统,由中压配电、变压器、低压配电、不间断电源、末端配电以及发电机等设备组成。其中,UPS的主要作用,是在市电电源中断、发电机启动之前,确保所带的负载持续供电,因此,UPS系统包含了储能设备,如蓄电池或飞轮;此外,传统UPS还具有隔离市电侧浪涌、电压骤升骤降等作用。
UPS系统是数据中心供电连续性的重要保障,UPS系统的可靠性直接影响数据中心的可靠性,同时,在绝大多数数据中心,UPS系统的损耗可占IT设备能耗的10%以上。因此,提高UPS系统的可靠性,同时降低其损耗,就成为数据中心UPS系统架构演变的主旋律。
1. 传统UPS供电系统
目前,数据中心内应用最广的不间断电源还是传统UPS,它主要由整流AC-DC、逆变DC-AC和静态旁路3部分电路组成,DC母线上挂接蓄电池,输入AC正常时,经整流和逆变两次转换后为负载供电,同时为蓄电池浮充,输入AC中断时,蓄电池由浮充转放电,经逆变器为负载供电,对负载来说,感受不到输入端电源的中断。
UPS设备的分类
从结构上看,UPS设备可以分为后备式、在线互动式、双转换在线式、Delta 转换在线式等类型,其中前两种主要用于小容量负载(≤5kVA),Delta转换在线式技术受专利保护,因此,大型数据中心主要采用双转换在线式UPS设备。
传统的双转换在线式UPS设备采用可控硅整流,主要的问题是谐波电流畸变率(THDi)高(10-30%),转换效率低(85-92%)。
随着电力电子器件的发展,呈现出IGBT取代可控硅整流的趋势,IGBT整流的优势是取消变压器,因而降低了成本,同时有比较好的输入特性,在较宽的负载范围内,可以将THDi控制在5-10%之间,最大的好处是效率的提升,通常在87-95%之间。目前,IGBT整流型UPS的可靠性比可控硅整流型略低。
UPS冗余设计
由于UPS设备结构复杂,因此自身容易发生故障,设备冗余可以提高可用性,UPS系统便有了N、N+X、2N、”市电+U电“等架构。
N系统满足基本需求,没有冗余的UPS设备。它的优点是系统简单,硬件配置成本低廉;由于UPS工作在设计满负荷条件下,因此效率较高。其缺点是可用性低,当UPS发生故障,负载将转换到旁路供电,无保护电源;在UPS、电池等设备维护期间,负载处于无保护电源状态;存在多个单故障点。
N+X并联冗余系统是指由N+X台型号规格相同且具有并机功能的UPS设备并联组成的系统,配置N台UPS设备,其总容量为系统的基本容量,再配置X台(X=1~N)UPS冗余设备,允许X台设备故障退出检修。相对于“N”系统,“N+X”系统在UPS配置上有了一定的冗余,系统可靠性有所提高,同时带来了系统配置成本的增加、系统负荷率的降低以及效率降低。N+X系统在成本增加不多的前提下提高了可用性,因此,在数据中心得到了广泛的应用,但是该系统在UPS输出端仍然存在单故障点,实际项目中由此造成的系统宕机屡见不鲜。
2N,为了消除单点故障,高等级数据中心通常采用2N冗余系统。该系统是指由两套或多套UPS系统组成的冗余系统,每套UPS系统N台UPS设备的总容量为系统的基本容量。该系统从交流输入经UPS设备直到双电源输入负载,完全是彼此隔离的两条供电线路,也就是说,在供电的整个路径中的所有环节和设备都是冗余配置的,正常运行时,每套UPS系统仅承担总负荷的一部分。这种多电源系统冗余的供电方式,克服单电源系统存在的单点故障瓶颈,对于少数单电源设备的情况,可通过安装小型STS设备,保证其供电可靠性。采用2N冗余系统可用性得到明显提高。
2N冗余系统的缺点也非常明显,设备配置多、成本高,通常情况下效率比N+X系统更低。
“市电+U电”供电架构由百度提出并在其自建M1数据中心规模应用,它在N+1系统基础上做了改进,UPS设备配置不变,将服务器等双电源设备的其中1路改由市电直接供电,消除了单点故障,可靠性较N+1系统大大提高,同时,UPS系统的损耗降低为原先的50%。UPS系统整体效率提升至95%以上。UPS ECO模式带来了效率的提升,其代价是IT负载由市电供电,UPS必须不断监视市电状态,并在发现问题且当该问题尚未影响负载时,迅速切换到逆变器供电。这个听起来简单,但实际操作起来非常复杂并且需要承担很多风险以及潜在的负面影响。
2. 高压直流(HVDC)不间断电源系统
尽管所有国家的市电都是交流,但是IT设备内部都采用直流供电,这就为直流供电提供了可能。事实上,通信行业采用直流48V供电已经有几十年的历史,电力行业也长期采用直流220V作为断路器等设备的操作和控制电源(直流屏)。
传统UPS设备存在效率低、可靠性差、灵活性和扩展性差、故障后不易修复等问题,所以业内一直在寻找替换UPS的方案。
现有主流的高压直流供电系统图,与通信行业48V直流系统架构基本一致。与传统双转换在线式UPS系统的主要区别,是取消了逆变环节,蓄电池挂接在直流母线,与整流器并联,同时为IT设备供电。由于直流电源拓扑简单,因此故障率较UPS有所降低,因采用模块化设计,可在线维护。
3. 分布式不间断电源系统
UPS或HVDC通常采用集中式供电方案,集中式系统的优点是可以实现资源共享,降低成本,其缺点是系统故障范围大,影响面广。
UPS也有小型机分布式供电方案,但是多套分布式小型机系统与1套集中式大型UPS系统相比,小型机的数量多,故障点多,成本高,因此大中型数据中心不会采用分布式UPS系统。
尽管有如上问题,但是对于分布式不间断电源系统的探索,从来没有停止过。谷歌和Facebook都在探索分布式不间断电源系统在IDC数据机房中的应用。
谷歌是最早进行服务器自研定制的互联网公司,同时也最早放弃了集中式UPS电源方案,转将蓄电池分布到每台服务器电源直流12V输出端。市电正常时,进入服务器电源转换成DC12V为服务器主板供电,同时为蓄电池提供浮充电源,市电停电后,由DC12V母线并联的蓄电池继续给主板供电,直到柴油发电机启动后回复交流供电。谷歌早期采用铅酸电池供电,因服务器内部高温导致铅酸电池故障率高,后改为锂电池方案。蓄电池的后备时间为分钟级(通常为1-3分钟)。 此方案的优点是大大简化了IT设备前端供电系统,缺点是服务器电源需要深度定制。
Facebook自建数据中心的供电系统采用DC48V离线备用系统。为每6个9kW的机柜配置1个铅酸蓄电池柜,输出为DC48V,服务器电源采用AC277V和DC48V双输入,市电正常时作为主用,市电中断后由蓄电池输出DC48V为服务器供电。蓄电池后备时间为45秒。此方案的系统效率与240V HVDC Offline方案及DC12V分布式系统相当。
随着业内对数据中心能耗关注日益增强,国内近几年出现了一种新型的分布式DC240V电源设备,同样采用离线方案,市电正常时,直接输出市电电源,市电停电后,由内部锂电池提供DC240V输出。 这种方案的优势是IT设备无需定制,只要兼容DC240V供电即可。其缺点是电源内部存在AC220V和DC240V的切换,系统可靠性降低;锂电池串联数量多,单只电池故障会影响系统的可靠性。 从实际应用效果看,某互联网公司租用的数据中心一年中发生十几起电源故障,证明此架构还需完善。
4. 未来发展趋势
过去,计算机作为一种非常娇贵的设备,双转换在线式UPS消除了市电电能质量问题,但带来了6-10%的电能损失以及其自身可靠性低的问题。
通过冗余可以提高系统可靠性,UPS发展出主备供电、N+1冗余并机、双总线、分布冗余等方案,相应带来的是成本和能耗的进一步增加。
为了避免UPS设备故障率高的问题,国内提出并已规模部署了直流240V电源系统,大部分IT设备可以直接兼容直流供电。
呈现如下三种趋势:
第一,从在线到离线。UPS ECO模式、DC48V电池备用、DC12V电池备用、DC240V电池备用等本质上都是将电源离线,从而降低电源成本和运行损耗。
第二,从集中到分布。随着锂电池等新型储能设备的发展以及大数据时代服务器快速部署、灵活扩展的需要,不间断电源设备正在从集中到分布。
第三,未来数据中心供电发展的整体趋势是由高压/集中式/交流大UPS向低压/分布式/直流小UPS方向发展,由机房外集中式铅酸电池向IT机柜内分布式小(锂)电池方向发展,从化石能源向绿色能源方向发展。