细分MTTR对模块化UPS系统可用性的影响
可用度(可用性)是一个可维护性指标,为系统在使用过程中,可以正常使用的时间与总时间之比。可用度A与平均无故障时间MTBF(Mean time between failure)和MTTR的关系是:本文引用地址:https://www.eepw.com.cn/article/178133.htm
可用度不仅与MTBF有关,而且与MTTR有关。因复杂系统的功能多、元器件多则MTBF降低。在MTBF不变的前提下,减小MTTR能有效提高系统的可用性A。
3 MTTR时间细分
MTTR是指故障发生到恢复功能的时间t,它由故障发生到故障自动检测时间t1、故障被检测出到维修工接到通知的时间t2、后勤保障时间t3、故障维修时间t4、恢复时间t5等多个时间段组成,即 t= t1+ t2+ t3+ t4+ t5,见图1。
图1 MTTR的时间细分
3.1 故障发生到系统自动检测出故障的时间t1
要求UPS具有完善的自我诊断功能,定位发生故障的位置和类型,限制故障扩大并给出故障信号。对于模块化UPS要求故障模块能自动保护退出系统,不能影响系统其它部分继续正常工作。一般来说,t1时间是ms~min数量级。
3.2 故障被检测出到人们知道时间t2
检测出的故障通过合适方式,如手机短信实时通知维护工。t2时间一般是s ~min数量级。
3.3 后勤保障时间t3
后勤保障时间是指人(维修工程师)和物(备品备件)从获知维修通知到抵达现场开始维修时间。t3时间是hours~days数量级。
人:最快是用户的维护工程师自己可以解决,其次是厂家当地维修工程师以及厂家工程师的快速响应能力(受厂家服务响应能力和交通工具影响)。
物:用户现场是否准备有足够可以替换的备品备件,如设备现场及厂家当地办事处没有备品备件,则需要厂家派人携带或者委托第三方运送备品备件到用户设备现场。对于模块化UPS,因不同容量的系统由相同的模块组成,准备一种模块即可。而对于传统集中式UPS,可能的故障部件无法定位和预计,为了提高修复概率,往往需要准备较多种类的备品备件。
案例:某国外品牌传统集中式UPS出现故障,时值年底,正值企业年底冲刺满负荷生产。因天气寒冷,电网负荷大,电网频繁停电并不可预测,而一旦停电,则流水线上芯片将全部报废,用户非常焦急。而当时UPS厂家在亚洲只有泰国曼谷办事处,并且需要派资深工程师携带大量的备品备件才能来华现场维修。签证需要时间,老外资深工程师签证、差旅、维修等费用也不菲。用户受不了漫长的等待造成停产带来的巨大损失和昂贵的维修报价,可后来检查结果非常意外:实际故障发生部位与厂家所谓资深维修工程师准备空运来的备件完全不同。
评论