新闻中心

EEPW首页 > 电源与新能源 > 设计应用 > 数据中心供电系统故障诱因分析

数据中心供电系统故障诱因分析

作者:时间:2011-04-19来源:网络收藏
数据中心的可靠性是至关重要的。可以想见,无论IT设备多么精密、系统的功能多么优越、可靠性多么高,一旦出现数据中心供电,再好的系统也无法运转。所以对运行中设备维护保养的重要性不可忽视,可见维保人员肩上的担子是很重的。

那我们如何有效保障数据中心的电源动力呢?我们需要一个能可以保障计算机系统在停电之后继续工作一段时间以使用户能够紧急存盘,使您不致因停电而影响工作或丢失数据,为计算机系统提供高质量的电源。他就是我们常说的UPS系统。

UPS—不间断电源系统,是一种含有储能装置、以逆变器为主要元件、稳压稳频输出的电源保护设备。在计算机和网络系统应用中,主要起两个作用:一是应急使用,防止电网突然断电而影响正常工作,给计算机系统造成损害;二是消除市电网上的电涌、瞬间高电压、瞬间低电压、暂态过电压、电线噪声和频率偏移等“电源污染”,改善电源质量,为计算机系统提供高质量的电源。在实际的应用中,各种原因引起的UP给用户带来了意想不到的经济损失。因此,如何建立一个合理的、安全的UPS成为大家关注的问题。本文将从UPS的诱因进行探讨。

一、数据中心供电故障原因1:UPS选型不当导致的故障

有的用户认为UPS都一样,所以就追求低价格,结果导致故障。比如某高速公路指挥部贪图便宜,第一天装机,第二天就起火;某人寿保险公司低价格购进的机器,不到半年因UPS故障而烧毁几乎所有IT设备的输入电路,导致系统瘫痪;又如某多台UPS并联的兆瓦级数据中心,装机没有几个月因其中一台UPS中的一个逆变器功率管击穿而导致所有UPS跳闸…

二、数据中心供电故障2:使用环境不当故障导致的故障

不按说明书上对环境的要求放置机器,甚至有的将UPS放在随便穿行的走廊、滴水的地下室。比如几台200kVA的UPS放在了屋顶只有一层预制板的平房,空调只是两台5P的舒适空调机,又如一个玻璃厂竟将UPS放在粉末飞扬的厂房内,等等。导致了频繁故障。

三、数据中心供电故障3:制度不健全导致的故障

比如有的值班人员随便将电炉子、电饭煲和吸尘器接在UPS上,导致过载跳闸;有的值班人员的食物引来老鼠钻入机器而导致起火。

四、数据中心供电故障4:交接故障

这类故障主要是由于管理人员的前后不是一拨人或配合不好造成。比如某火车站售票系统,前面值机人员由于移动机器位置而将UPS的外接电池组断开,事后又未向后来者交代,结果造成了市电和UPS同时停电的故障…

五、数据中心供电故障5:经验故障

经验是不可缺少的,是不可多得的财富。但经验有其相对性,即在某种UPS上得到的经验不一定完全适合另一种UPS,否则就会导致故障。某电信局由于不看说明书而用同样的方法启动另一品牌机器导致逆变器烧毁。

六、数据中心供电故障6:失察故障

一些器件在运行中会出现老化或早期失效,如不及时检查发现就会导致故障。这些在自动监控中是无法发现的。比如因老化而开始弯曲的保险丝,电池结构螺丝的松动,电池长时间放点后使电池壳有微细的裂缝等,如不及时发现或发现后没有及时处理都可造成故障。

七、数据中心供电故障7:仓促上阵导致的故障

搞维修保养来不得半点急躁,要考虑周全后再动手。某公司工程师要对一用户正在运行的UPS进行检修,按照规定要用维修旁路开关将UPS退出后再检修,但按照程序需先启动自动旁路,而后再合维修旁路的闸刀。也许该工程是还有其他急事要办,进机房后未经考虑就闭合了维修旁路闸刀,结果造成逆变器功率管爆炸。

八、数据中心供电故障8:维护不当导致的二次故障

对UPS的定期维护是必要的,但应有一套严格的管理程序。那些不负责任、不按规定要进行定期或不定期保养是导致机器故障的重要原因。另外,在维护保养时也可导致故障,比如用万用表探针测量电路板电位时,探针将两点短路导致故障。一用户作电池放电时,将电池从UPS上摘下,放电后将电池接回时机型解放,导致电流爆炸。又如一工程师在更换离心风机时不小心活动扳手一打滑打在了控制板上,当时没有在意,风机换好后不能开机,检查发现一条器件退被打断了…

九、数据中心供电故障9:静电导致的故障

某机房按例停机保养,但保养后却无法开机。检查后发现一个组件电压击穿,回忆为保过程发现该控制板用塑料牙刷扫过灰尘。塑料在干燥器件的表面可产生几千伏的摩擦静电电压,由于机器内小信号电路使用了一些MOS器件,这些器件耐压很低而且最怕静电。经测量一个普通塑料袋,用电路板摩擦以下就可产生3000V的静电电压。所以在检查这些电路板时最好手腕上要讨一个接地环。

十、数据中心供电故障10:过分自信导致的故障

做事情自信是成功的基础,但过分自信有时就会出错。比如某国际银行在UPS运行了8年后就应该更新设备,厂家也多次提醒。由于该UPS8年来很少出问题,所以用户负责人屡次回答“不用更新”,结构几个月后该UPS因老化故障而停止供电两小时,导致全球业务也断两小时,损失很大。根据国际上的统计资料,5年标称的电池服务寿命最多不超过3年。在平时不保养的情况下,一般2年就应该更换。某飞机场候机厅电池原配4h,3年后人不更换,一次外电网停电,UPS后备时间只剩4h,由于停电造成了损失。像类似的人为故障现象还有很多,就不一一例举了。

归根到底,电源系统的选型是第一关,这一道关把不住首先就种下了隐患的种子。电源系统的连接是第二关,有了好的设备,如果没有好的连接方案,也会埋下隐患。某电视台由于连接方案被厂家误导。十几套节目的供电UPS故障接连不断,而且大都是有惊无险,一连几年都是这样,使维保人员提心吊胆、伤透了脑筋。连接方案是一个工程,不是维保人员左右的了的。无奈只好在重大活动和节日令厂家工程师前来值班。这又有什么用呢!厂家的工程师到此也只能是给用户心理上以安慰。该告警的时候照样告警,只求上帝保佑不要停电!

所以UPS的选购就相当重要了!关于UPS的选购我们总结了以下几点,希望对大家有所帮助。

(1)确认所需UPS的类型对于金融、证券、电信、交通等重要行业,应选择性能优异、安全性高的在线式UPS;对于网络用户,除考虑选择在线式UPS外,还可选择在线互动式UPS;对于家庭用户,可选择后备式UPS。

(2)确定所需UPS的功率计算UPS功率的方法是:UPS功率=实际设备功率×安全系数。其中,安全系数是指大设备的启动功率,一般选1.5。

(3)考虑发展余量除考虑实际负载以外,还要考虑今后设备的增加所带来的增容问题,因此UPS的功率应在现有负载的基础上再增加15%的余量。

(4)选择品牌和售后服务最好选择保修期长,售后服务及时周到的UPS。这样,产品供应商可以方便地对其产品及时进行维护和维修,从而保证用户的正常使用。

UPS高端用户选择的大都是进口品牌的UPS电源产品,国外的很多产品在技术上五花八门,大都是成熟产品,国内的很多用户也都选择有很好运行业绩的产品,但毕竟是国外的产品,在技术支持和服务上想必许多客户都有不愉快的经历,尤其是在中方技术人员无法处理的时候,往往给终端用户造成损失。当然许多事情可以防范于未然,提前做好一定的准备可以把损失减少。■



关键词: 供电系统 故障

评论


相关推荐

技术专区

关闭