空載UPS輸入開關(guān)燒毀事故分析與探討
作者:潘彩敏
摘要:
本文針對(duì)某數(shù)據(jù)中心在2024年多次發(fā)生的、在特定運(yùn)行工況下的2臺(tái)UPS并機(jī)系統(tǒng)空載側(cè)輸入開關(guān)燒毀事故,進(jìn)行了系統(tǒng)的闡述與深入分析。事故復(fù)現(xiàn)性測(cè)試揭示了關(guān)鍵現(xiàn)象:當(dāng)系統(tǒng)處于單臺(tái)UPS帶載125%負(fù)荷,而另一臺(tái)UPS空載并聯(lián)在線運(yùn)行時(shí),空載UPS的輸入側(cè)A、B兩相會(huì)涌現(xiàn)高達(dá)5600A的異常環(huán)流,并伴隨嚴(yán)重的諧波畸變,最終導(dǎo)致其前端斷路器因內(nèi)部電流互感器(CT)過熱而損毀。本文通過詳盡的現(xiàn)場(chǎng)測(cè)試數(shù)據(jù),結(jié)合系統(tǒng)架構(gòu)與運(yùn)行模式,逐步剖析了事故現(xiàn)象,排除了系統(tǒng)諧振等常見因素,并將故障根源指向了空載UPS在特定并聯(lián)控制策略下產(chǎn)生的內(nèi)部環(huán)流。盡管UPS生產(chǎn)廠家承認(rèn)其設(shè)備在此工況下存在控制策略缺陷,但未提供根本原因?;诖?,本文最終得出結(jié)論,并為數(shù)據(jù)中心UPS系統(tǒng)的安全運(yùn)行與測(cè)試規(guī)程提出了具體的優(yōu)化建議,以避免同類事故的再次發(fā)生。
關(guān)鍵詞: UPS并機(jī)系統(tǒng);輸入開關(guān)燒毀;異常環(huán)流;諧波分析;故障復(fù)現(xiàn);控制策略
1、引言
不間斷電源(UPS)系統(tǒng)作為數(shù)據(jù)中心、工業(yè)控制及其他關(guān)鍵基礎(chǔ)設(shè)施的核心供電保障環(huán)節(jié),其運(yùn)行的可靠性與穩(wěn)定性直接關(guān)系到后端負(fù)載的連續(xù)性與安全性。通常,通過并聯(lián)冗余配置可以提升系統(tǒng)的可用性。然而,復(fù)雜的并聯(lián)交互機(jī)制也可能引入非預(yù)期的運(yùn)行風(fēng)險(xiǎn)。
本案例聚焦于某數(shù)據(jù)中心一套2臺(tái)600kVA UPS組成的并聯(lián)系統(tǒng)。在2024年6月24日進(jìn)行的常規(guī)單機(jī)125%負(fù)荷能力測(cè)試中,首次發(fā)生了非預(yù)期現(xiàn)象:帶載UPS運(yùn)行正常,而空載并聯(lián)運(yùn)行的UPS其輸入斷路器在測(cè)試開始約8分鐘后出現(xiàn)嚴(yán)重過熱、冒煙,最終燒毀。初次故障因缺乏詳實(shí)數(shù)據(jù),分析受阻,斷路器專家的初步判斷指向諧波過大問題。
為確保供電系統(tǒng)的長期安全,我們?cè)?024年9月24日第二次發(fā)生同類事故后,立即制定了周密的測(cè)試方案,并于9月26日成功復(fù)現(xiàn)了故障。此次測(cè)試部署了多臺(tái)高性能電能質(zhì)量分析儀,完整記錄了故障發(fā)生前后關(guān)鍵節(jié)點(diǎn)的電氣參數(shù),為本次深入的、數(shù)據(jù)驅(qū)動(dòng)的故障分析提供了決定性的依據(jù)。本文旨在系統(tǒng)性地呈現(xiàn)此次事故的分析全過程,以期為同行提供借鑒。
2、事故現(xiàn)象描述
2.1 系統(tǒng)架構(gòu)與運(yùn)行狀態(tài)
事故系統(tǒng)為一個(gè)典型的模塊化供電架構(gòu),包含一路市電和一路柴油發(fā)電機(jī)作為電源輸入(測(cè)試時(shí)僅市電投入)。下游低壓配電系統(tǒng)中,核心為兩臺(tái)并聯(lián)的600kVA高頻UPS。測(cè)試期間的具體開關(guān)狀態(tài)與電流路徑如下圖所示:
· 市電總進(jìn)線開關(guān)合閘,柴發(fā)進(jìn)線開關(guān)分?jǐn)唷?
· 兩臺(tái)UPS輸入開關(guān)均合閘。
· 兩臺(tái)UPS均啟動(dòng),運(yùn)行于“在線模式”并處于并機(jī)狀態(tài)。
· UPS-1.1的輸出開關(guān)合閘,連接至720kVA假負(fù)載。
· UPS-1.2的輸出開關(guān)分?jǐn)?/strong>,處于空載狀態(tài)。
· 同一母線段的其他饋線負(fù)載未投入。
此狀態(tài)可簡(jiǎn)言之為:“一主一備”并聯(lián)模式,其中“備機(jī)”UPS-1.2空載熱備份。
2.2事故過程回顧
2024年6月24日及9月24日,在進(jìn)行單臺(tái)UPS(UPS-1.1)帶729kVA(125%額定容量)假負(fù)載運(yùn)行10分鐘的測(cè)試中,事故重復(fù)發(fā)生。測(cè)試進(jìn)行至約8分鐘時(shí),現(xiàn)場(chǎng)人員聞到強(qiáng)烈焦糊味,隨即發(fā)現(xiàn)空載的UPS-1.2輸入開關(guān)柜內(nèi)冒煙。緊急執(zhí)行分閘、卸負(fù)載、關(guān)機(jī)操作后,將斷路器拉出檢查,發(fā)現(xiàn)其底部(電源進(jìn)線側(cè))A、B兩相接線端子嚴(yán)重發(fā)燙,初步判斷為內(nèi)部過熱。
2.3 事故復(fù)現(xiàn)測(cè)試(2024.9.26)
為捕獲故障本質(zhì),我們于9月26日設(shè)計(jì)了完全復(fù)現(xiàn)6.24工況的測(cè)試。測(cè)試系統(tǒng)部署了5臺(tái)電能質(zhì)量分析儀(FLUKE 435、YOKOGAWA WT1800等),精確布置了以下測(cè)量點(diǎn)(如下圖):
· 測(cè)量點(diǎn)1: 市電總進(jìn)線開關(guān)輸出側(cè)(系統(tǒng)總覽)。
· 測(cè)量點(diǎn)3: UPS-1.2輸入開關(guān)下游側(cè)(故障點(diǎn)關(guān)鍵數(shù)據(jù))。
· 測(cè)量點(diǎn)4: UPS-1.2輸出開關(guān)上游側(cè)(觀察UPS輸出狀態(tài))。
· 測(cè)量點(diǎn)5: UPS-1.1輸入開關(guān)下游側(cè)(帶載UPS輸入特性)。
· 測(cè)量點(diǎn)6: UPS-1.1輸出開關(guān)上游側(cè)(帶載UPS輸出特性)。
測(cè)試步驟嚴(yán)格遵循既定流程:下午送電,依次合閘中壓、低壓進(jìn)線開關(guān)、兩臺(tái)UPS輸入開關(guān);啟動(dòng)兩臺(tái)UPS至并機(jī)在線模式;合上同一母線的其他饋線開關(guān);最后合上UPS-1.1的輸出開關(guān)。在系統(tǒng)空載運(yùn)行約半小時(shí)建立穩(wěn)態(tài)后,于50秒內(nèi)將假負(fù)載從300kVA平穩(wěn)加載至720kVA。加載約8分鐘后,空載UPS-1.2的輸入開關(guān)如期開始冒煙,故障被成功復(fù)現(xiàn),全過程數(shù)據(jù)被完整記錄。
3、測(cè)試數(shù)據(jù)及深度分析
3.1 加載前基準(zhǔn)狀態(tài)分析
在UPS-1.1加載720kVA負(fù)載之前,系統(tǒng)處于兩臺(tái)UPS空載并聯(lián)運(yùn)行狀態(tài)。對(duì)比測(cè)量點(diǎn)1、3、5的數(shù)據(jù),旨在驗(yàn)證測(cè)試接線的正確性與系統(tǒng)的初始平衡性。
數(shù)據(jù)分析要點(diǎn):
· 總有功功率: 測(cè)量點(diǎn)1(總進(jìn)線)為17.4kW,測(cè)量點(diǎn)3(UPS-1.2)與測(cè)量點(diǎn)5(UPS-1.1)之和約為17kW,兩者基本吻合,表明電能主要消耗于兩臺(tái)UPS的空載運(yùn)行。
· 電流與諧波: 兩臺(tái)UPS的輸入電流(測(cè)量點(diǎn)3和5)幅值處于同一數(shù)量級(jí)(15-44A),電流諧波失真率(THDi)在12%-25%之間,頻譜分布特征也基本一致。這是高頻機(jī)UPS空載運(yùn)行的典型特征。
· 初步結(jié)論: 加載前,兩臺(tái)UPS工作狀態(tài)對(duì)稱,系統(tǒng)基線正常,測(cè)試儀器數(shù)據(jù)可信,為后續(xù)異常分析提供了可靠的對(duì)比基準(zhǔn)。
3.2 加載后異常狀態(tài)與關(guān)鍵發(fā)現(xiàn)
加載720kVA負(fù)載后,系統(tǒng)電氣參數(shù)發(fā)生劇烈變化,空載UPS-1.2的異?,F(xiàn)象是分析的核心。
3.2.1 帶載UPS-1.1與系統(tǒng)總進(jìn)線(測(cè)量點(diǎn)1 & 5)
- 測(cè)量點(diǎn)1和測(cè)量點(diǎn)5的數(shù)據(jù)高度一致:總有功功率約765kW,總電流約1130A,功率因數(shù)接近1,THDi極低(約2.5%)。
- 解讀: 這表明帶載的UPS-1.1工作完全正常,其所需能量幾乎全部由電網(wǎng)通過市電進(jìn)線提供,整流器工作于理想狀態(tài)。系統(tǒng)總進(jìn)線的良好電能質(zhì)量排除了電網(wǎng)側(cè)存在嚴(yán)重問題或系統(tǒng)諧振的可能性。
3.2.2 空載UPS-1.2輸入側(cè)(測(cè)量點(diǎn)3)——故障核心
此測(cè)量點(diǎn)的數(shù)據(jù)揭示了事故的直接原因:
- 巨大的異常電流: A相和B相總電流高達(dá)5600A以上,而C相電流僅為57A,中性線電流為4A。這形成了極其嚴(yán)重的三相不平衡。
- 嚴(yán)重的諧波畸變: THDi高達(dá)64%-69%。諧波分析顯示,2次諧波電流尤為突出,A相達(dá)863A,B相高達(dá)1274A。3次、4次等偶次和奇次諧波電流也達(dá)到數(shù)百安培量級(jí)。
- 功率反向與畸變: A相和B相有功功率為負(fù)值(-24.8kW, -159kW),視在功率異常巨大(1521kVA, 913kVA),功率因數(shù)為負(fù)且接近于零。
- 解讀:
1) 異常環(huán)流: 巨大的A、B相電流主要并非流向UPS-1.2的整流器(因其空載,正常電流應(yīng)很?。?,而是在UPS-1.2的輸入回路內(nèi)部(可能通過其輸入濾波器、旁路電路或整流橋臂)形成了相間環(huán)流。這種環(huán)流在A-B相之間構(gòu)成回路,因此C相和N線電流很小。
2) 能量回饋: 負(fù)的有功功率表明,在UPS-1.2的A、B相輸入側(cè),存在能量從UPS端向電網(wǎng)側(cè)回送的現(xiàn)象。這并非正常的逆變器回饋,而是異常運(yùn)行狀態(tài)下的表現(xiàn)。
3) 諧波源: 豐富的諧波,特別是強(qiáng)烈的2次諧波,通常與系統(tǒng)的不對(duì)稱和非線性運(yùn)行有關(guān),這進(jìn)一步印證了內(nèi)部電力電子器件處于異常導(dǎo)通或控制失穩(wěn)狀態(tài)。
4、故障機(jī)理綜合分析與推斷
基于上述測(cè)試數(shù)據(jù),我們進(jìn)行層層遞進(jìn)的推理分析:
4.1 排除性分析
- 系統(tǒng)諧振排除: 總進(jìn)線(測(cè)量點(diǎn)1)電流諧波含量極低,且電壓總諧波失真率(THDu)未見異常升高,可排除電網(wǎng)側(cè)或系統(tǒng)級(jí)諧振引發(fā)過電流的可能。
- 測(cè)試誤差排除: 加載前后數(shù)據(jù)自洽,測(cè)量點(diǎn)1和5的一致性證明了測(cè)試系統(tǒng)的準(zhǔn)確性。
- 斷路器本體質(zhì)量問題: 雖初步懷疑,但連續(xù)三起相同工況下的相同故障,且能與異常電流數(shù)據(jù)精確對(duì)應(yīng),表明斷路器是在承受了遠(yuǎn)超其設(shè)計(jì)能力的異常電流后失效,問題根源在于系統(tǒng)運(yùn)行狀態(tài)而非斷路器本身。
4.2 根本原因推斷
所有證據(jù)均指向空載UPS-1.2的內(nèi)部運(yùn)行狀態(tài)。在并聯(lián)系統(tǒng)中,兩臺(tái)UPS的輸出通過并機(jī)柜強(qiáng)制同步。當(dāng)UPS-1.1滿載時(shí),其直流母線電壓可能因負(fù)載沖擊而略有波動(dòng)。此時(shí),處于在線模式但空載的UPS-1.2,其控制系統(tǒng)的任務(wù)是維持與UPS-1.1的精確同步,并穩(wěn)定自身的直流母線電壓。
推測(cè)的故障鏈如下:
1) 控制策略觸發(fā): 在單機(jī)重載、另一臺(tái)空載的極端不平衡工況下,空載UPS(UPS-1.2)的整流器控制邏輯可能進(jìn)入一個(gè)非預(yù)期的“環(huán)流運(yùn)行模式”。
2) 形成通路: 該控制模式可能導(dǎo)致UPS-1.2整流橋的某些開關(guān)器件(例如,與A、B相相關(guān)的IGBT)以異常的時(shí)序和占空比工作,并未進(jìn)行有效的整流,反而在A、B相輸入電感/濾波器之間形成了一個(gè)低阻抗的環(huán)流通路。
3) 電流激增與諧波產(chǎn)生: 該通路被系統(tǒng)電壓激勵(lì),產(chǎn)生巨大的工頻環(huán)流。同時(shí),由于電力電子器件的快速開關(guān)與線路非線性,該環(huán)流被“斬切”和“調(diào)制”,產(chǎn)生了大量以2次諧波為主的諧波電流。
4) 過熱損壞: 此高達(dá)5600A的異常電流完全通過UPS-1.2的輸入電纜和其前端斷路器。斷路器內(nèi)部的A、B相電流互感器(CT)持續(xù)承受此巨大電流,導(dǎo)致鐵芯飽和、渦流損耗急劇增加,最終因過熱而燒毀。斷路器拆解結(jié)果(A、B相CT嚴(yán)重?zé)龤В珻相輕微受損)與測(cè)量數(shù)據(jù)完美吻合(見下圖)。
4.3 廠家反饋與待解問題
與UPS廠家技術(shù)專家聯(lián)合會(huì)診后,廠家承認(rèn)其UPS的固件控制程序在此特定“一重一空”并聯(lián)工況下存在設(shè)計(jì)缺陷,會(huì)導(dǎo)致系統(tǒng)產(chǎn)生不可控的環(huán)流。然而,廠家未能清晰說明該環(huán)流產(chǎn)生的具體電路路徑和精確的觸發(fā)控制邏輯,這仍然是需要深入剖析的“黑箱”問題。
5. 結(jié)論
通過對(duì)多起同類型事故的復(fù)現(xiàn)、測(cè)試與系統(tǒng)性分析,本文得出以下明確結(jié)論:
1. 直接原因: 在2臺(tái)UPS并聯(lián)系統(tǒng)中,進(jìn)行單機(jī)重載(125%)、另一臺(tái)空載在線的測(cè)試時(shí),空載UPS會(huì)因其內(nèi)部控制策略缺陷,在輸入側(cè)A、B相產(chǎn)生高達(dá)5600A的異常環(huán)流,并伴隨嚴(yán)重的諧波失真。
2. 損壞機(jī)制: 此異常電流長期流經(jīng)空載UPS的前端斷路器,導(dǎo)致其內(nèi)部A、B相電流互感器(CT)因極端過熱而燒毀,是開關(guān)冒煙和損壞的直接物理機(jī)制。
3. 問題根源: 故障的根本原因在于UPS設(shè)備在特定并聯(lián)冗余邏輯下的控制策略不完善,未能有效抑制或避免此種不平衡工況下的內(nèi)部環(huán)流。
5.2 建議
鑒于該故障復(fù)現(xiàn)率極高,且UPS廠家短期內(nèi)未能提供根本解決方案,為保障數(shù)據(jù)中心供電系統(tǒng)的安全,提出以下分級(jí)建議:
1. 立即措施(規(guī)避風(fēng)險(xiǎn)):
o 在所有已投運(yùn)或新建的2臺(tái)UPS并聯(lián)系統(tǒng)中,嚴(yán)格禁止“一臺(tái)帶載、另一臺(tái)空載在線”的運(yùn)行工況。
o 進(jìn)行單機(jī)測(cè)試時(shí),若非測(cè)試UPS不需投入,應(yīng)將其輸入斷路器完全分閘,使其在電氣上徹底脫離系統(tǒng),而非僅保持空載在線。
2. 中期措施(優(yōu)化操作):
o 修訂UPS系統(tǒng)測(cè)試與運(yùn)維規(guī)程,明確規(guī)定在并聯(lián)系統(tǒng)中,應(yīng)盡量保持各臺(tái)UPS的負(fù)載率相對(duì)均衡,避免極大的負(fù)載差異。
o 考慮在UPS輸入回路增設(shè)高級(jí)保護(hù)繼電器,監(jiān)測(cè)相電流不平衡度和諧波含量,在檢測(cè)到異常環(huán)流時(shí)提前告警或跳閘。
3. 長期措施(根本解決):
o 督促并配合UPS制造商,深入分析并升級(jí)其控制固件,從算法層面徹底解決此異常環(huán)流問題。應(yīng)在廠內(nèi)進(jìn)行充分的極端工況測(cè)試以驗(yàn)證解決方案。
o 在未來的UPS設(shè)備招標(biāo)與技術(shù)協(xié)議中,應(yīng)將“在N+1并聯(lián)系統(tǒng)中,單機(jī)滿載、其余空載的運(yùn)行穩(wěn)定性”作為一項(xiàng)強(qiáng)制性驗(yàn)證要求,并要求廠家提供相關(guān)的型式試驗(yàn)報(bào)告。
參考文獻(xiàn)
[1] IEC 62040-3: Uninterruptible power systems (UPS) - Part 3: Method of specifying the performance and test requirements.
[2] Fluke Corporation. Fluke 435 Series II Power Quality and Energy Analyzer User Manual.


