运维过程中人为造成的数据中心UPS供电系统故障有哪些?

人为造成的数据中心中UPS供电系统故障有哪些?

数据中心供电系统的可靠性是至关重要的。可想而知,无论IT设备多么精密、系统的功能多么优越、可靠性多么高,一旦停电,再好的系统也无法运转。所以对运行中设备维护保养的重要性不可忽视,可见维保人员肩上的担子是很重的。

为了保障供电系统的可靠运行,有很多地方都制定了很多很好的措施。但即使如此也有很多漏洞。设备出厂后的可靠性就已确定,比如有的先天不足,像有的电源输出隔离变压器绕组用铝漆包线代替了电缆铜漆包线,在满载运行时十有八九是要出事的……不过由于设备本身的质量问题而导致的故障统计表明不足30%,70%的故障来自后天。也就是人为故障,其表现如下:

1. 选型不当导致的故障

(1)基本概念不清,易受厂家误导。

比如某高速公路招标UPS,在标书中要求UPS要具有输入断一相或两相后电池不放电,还能继续供电的能力。因为有的厂家标榜他的UPS在输入断一相后电池不放电,UPS还有50%的供电能力;输入断两相后电池仍不放电,UPS还有25%的供电能力,延长了电池的使用寿命。用户就认为这个性能好,稍动脑筋不难发现其弊病:若想享受其优点必须购买4倍于负载容量的UPS,否则断一相后就带不动当前的负载了。话又说回来,如果UPS断的是输入开关后面的两条线怎么办?还修不修?何时修?是否完全断电后才能修?等等这一系列问题如何解决。如果用户真的按负载实际容量购买了这样的UPS,这就是莫大的隐患,这是靠运维解决不了的问题。

(2)不便说明的原因。

比如有的用户从上个世纪就开始使用某品牌的机器,当时由于客观原因尽管输入功率因数低、效率低、体积大、耗电多和价格贵而无法也不便解决。现在比原来机型优越的多的新机型早已问世,比如新型的高频机结构UPS每一百千瓦每年要比原来工频机机结构的UPS节约5万度电,而这个几兆瓦容量的机房每年就可节约几百万度电。但由于某种原因,硬是放着节能设备不选而仍将那种耗能的机器写入标书,这样做还怕不保险,还把那种机器的结构特点写入标书。这不但增加了空调设备的投资和占地面积,无疑也为今后的运行埋下了隐患。这又是运维中无法解决的问题。

(3)追求低价格。

有的用户认为UPS都一样,所以就追求低价格,结果导致故障。比如某高速公路指挥部贪图便宜,第一天装机,第二天就起火;某人寿保险公司低价格购进的机器,不到半年因UPS故障而烧毁几乎所有IT设备的输入电路,导致系统瘫痪;又如某多台UPS并联的兆瓦级数据中心,装机没有几个月因其中一台UPS中的一个逆变器功率管击穿而导致所有UPS跳闸……

2. 使用环境不当故障导致的故障

不按说明书上对环境的要求放置机器,甚至有的将UPS放在随便穿行的走廊、滴水的地下室。比如几台200kVA的UPS放在了屋顶只有一层预制板的平房,空调只是两台5P的舒适空调机,又如一个玻璃厂竟将UPS放在粉末飞扬的厂房内,等等。导致了频繁故障。

3. 制度不健全导致的故障

比如有的值班人员随便将电炉子、电饭煲和吸尘器接在UPS上,导致过载跳闸;有的值班人员的食物引来老鼠钻入机器而导致起火……

4. 交接故障

这类故障主要是由于管理人员的前后不是一拨人或配合不好造成。比如某火车站售票系统,前面值机人员由于移动机器位置而将UPS的外接电池组断开,事后又未向后来者交代,结果造成了市电和UPS同时停电的故障……

5. 经验故障

经验是不可缺少的,是不可多得的财富。但经验有其相对性,即在某种UPS上得到的经验不一定完全适合另一种UPS,否则就会导致故障。某电信局由于不看说明书而用同样的方法启动另一品牌机器导致逆变器烧毁。

6. 失察故障

一些器件在运行中会出现老化或早期失效,如不及时检查发现就会导致故障。这些在自动监控中是无法发现的。比如因老化而开始弯曲的保险丝,电池结构螺丝的松动,电池长时间放电后使电池壳有微细的裂缝等,如不及时发现或发现后没有及时处理都可造成故障。

7. 仓促上阵导致的故障

搞维修保养来不得半点急躁,要考虑周全后再动手。某公司工程师要对一用户正在运行的UPS进行检修,按照规定要用维修旁路开关将UPS退出后再检修,但按照程序需先启动自动旁路,而后再闭合维修旁路的闸刀。也许该工程是还有其他急事要办,进机房后未经考虑就闭合了维修旁路闸刀,结果造成逆变器功率管爆炸。

8. 维护不当导致的二次故障

对UPS的定期维护是必要的,但应有一套严格的管理程序。那些不负责任、不按规定要求进行定期或不定期保养是导致机器故障的重要原因。另外,在维护保养时也可导致故障,比如用万用表探针测量电路板电位时,探针将两点短路导致故障。一用户作电池放电时,将电池从UPS上摘下,放电后将电池接回时机型解放,导致电流爆炸。又如一工程师在更换离心风机时不小心活动扳手一打滑打在了控制板上,当时没有在意,风机换好后不能开机,检查发现一条器件腿被打断了……

9. 静电导致的故障

某机房按例停机保养,但保养后却无法开机。检查后发现一个组件电压击穿,回忆维保过程发现该控制板用塑料牙刷扫过灰尘。塑料在干燥器件的表面可产生几千伏的摩擦静电电压,由于机器内小信号电路使用了一些MOS器件,这些器件耐压很低而且最怕静电。经测量一个普通塑料袋,用电路板摩擦一下就可产生3000V的静电电压。所以在检查这些电路板时最好手腕上要套一个接地环。

10. 过分自信导致的故障

做事情自信是成功的基础,但过分自信有时就会出错。比如某国际银行在UPS运行了8年后就应该更新设备,厂家也多次提醒。由于该UPS8年来很少出问题,所以用户负责人屡次回答“不用更新”,结果几个月后该UPS因老化故障而停止供电两小时,导致全球业务也中断两小时,损失很大。

总结

根据国际上的统计资料,5年标称的电池服务寿命最多不超过3年。在平时不保养的情况下,一般2年就应该更换。某飞机场候机厅电池原配4h,3年后仍不更换,一次外电网停电,UPS后备时间只剩4h,由于停电造成了损失……

像类似的人为故障现象还有很多,就不一一例举了。

归根到底,电源系统的选型是第一关,这一道关把不住首先就种下了隐患的种子。电源系统的连接是第二关,有了好的设备,如果没有好的连接方案,也会埋下隐患。某电视台由于连接方案被厂家误导。十几套节目的供电UPS故障接连不断,而且大都是有惊无险,一连几年都是这样,使维保人员提心吊胆、伤透了脑筋。连接方案是一个工程,不是维保人员左右的了的。无奈只好在重大活动和节日令厂家工程师前来值班。这又有什么用呢?厂家的工程师到此也只能是给用户心理上以安慰。

本文来自投稿,不代表弱电智能网立场,如若转载,请注明出处:https://www.ruodian360.com/idc/6351.html

题图来自 Unsplash,基于 CC0 协议

(2)
上一篇 2022年5月10日 上午12:29
下一篇 2022年5月11日 下午9:53

相关推荐

  • 数据中心的物理安全性在未来将如何提升?

    近年来,数据中心市场对安全解决方案的需求急剧增加。随着市场的持续快速增长,它为供应商和运营商带来了更多的机遇和挑战。 数据中心行业将面临两个主要的挑战:首先是合规性,法规遵从性正在增加,数据中心运营商需要做更多工作,不仅要遵守法规,还为数据中心资产提供具有安全保障的环境。 其次是人为错误,数据中心工作人员和操作人员不可避免地会犯错误,可能无意之间影响了数据中…

    2018年11月27日
    001.9K
  • 一篇文章说清楚了数据中心是什么,有什么,等级有哪些?

    数据中心是一个或多个建筑物的设施,其中包含集中式计算基础设施,通常是服务器、存储和网络设备。 在这个应用程序、大数据和数字化一切的世界中,如果没有尖端的计算基础设施,您将无法保持行业领先地位。 如果你想把东西放在内部,答案就是数据中心。 它的主要作用是支持所有组织用来运行业务的所有关键业务应用程序和工作负载。 在本文中,我们将准确分解数据中心中的内容、不同类…

    4天前 机房工程
    002.2K
  • 切勿视而不见——数据中心机柜的清理与保养

    运维是数据中心最重要的工作组成部分,但对于机柜的保养和清理往往被忽视。大部分运维工程师的精力都会被服务器、网络设备等占据,机柜安装好后,万事大吉不闻不问是常态。实际上,定期清理和保养机柜除了可以保障机房清洁外,还可以延长使用寿命、及时发现隐患、杜绝灰尘、杂物引起的故障等。 一、机柜除尘准备工作 1、设定合理的除尘周期 根据机房的具体情况设定合理的除尘周期,并…

    2019年10月8日
    002.0K
  • 关于网络机柜中的PDU电源插座,你了解多少?

    PDU电源插座是一种为各种电子设备、仪器仪表、通讯线路提供安全电源的电子装备,旨在分配和管理电源。在每个网络系统中都需要用到PDU电源插座,它能为系统中的设备提供电源确保正常工作,因此PDU电源插座是网络系统中必备设备。那么关于PDU电源插座,您又了解多少呢? PDU电源插座的功能作用 PDU电源插座一般应用于数据中心、配电机房、工业厂矿、生产车间、电脑机房…

    2018年6月21日
    003.9K
  • 网络数据中心机房吊顶与隔断墙装修标准规范

    网络数据中心机房的室内装修工程施工验收主要包括吊顶、隔断墙、门、窗、墙壁装修、地面、活动地板的施工验收及其他室内作业。 一般规定 ●网络数据中心机房的室内装修工程施工验收主要包括吊顶、隔断墙、门、窗、墙壁装修、地面、活动地板的施工验收及其他室内作业。 ●室内装修作业应符合《装饰工程施工及验收规范》、《地面及楼面工程施工及验收规范》、《木结构工程施工及验收规范…

    2016年11月4日
    004.4K
  • 你了解并联UPS系统的配置吗?

    并联运行描述了这样一种配置,即将两个或两个以上的不间断电源模块的输出连接在一起,通过一个共同的交流母线,提供给负荷。为了能够成功地做到这一点,每一个不间断电源模块必须能够并联运行,但并非所有的UPS都能够并联运行。要做到能够并联运行,模块需要配备并行卡,然后通过线(光)缆连结,形成一个闭环的数据通信系统。 这使得数据在不间断电源的模块之间进行交换。如果有需要…

    2017年6月8日
    005.0K

发表评论

登录后才能评论
关注我们