中心議題:
- UPS電源的可靠性
- UPS系統(tǒng)的可靠性
- 配電系統(tǒng)的可用性
解決方案:
- 采用旁路與市電獨立的電源
- 加入多CPU監(jiān)控及電池監(jiān)控
- 系統(tǒng)選擇模塊化結構
UPS電源的可靠性
從單個UPS的設計來說,可以把整個產(chǎn)品按照模塊進行劃分,下面圖中是一個典型的UPS系統(tǒng)結構圖
從圖中可以看到,UPS各個模塊之間的依賴關系比較復雜,但是還是可以分出串并聯(lián)的關系如下
輔助電源與所有其他模塊都是串聯(lián)的,因此輔助電源的可用性直接限制了系統(tǒng)能夠達到的最高可用性等級;
控制模塊與除輔助電源之外的其他模塊也都是串聯(lián)的,因此控制模塊的可用性也會直接影響到系統(tǒng)總體可用性設計;
對于負載端來說,能夠直接相連的只有旁路模塊與逆變模塊,而這兩個模塊是并聯(lián)的;
PFC/整流模塊與電池升壓模塊是并聯(lián)的,之后再與逆變模塊串聯(lián);
從能源提供者來講,這里旁路電源與市電電源是兩路獨立的電源,而電池能源是由市電經(jīng)過充電模塊提供的。如果充電模塊故障的話電池就沒有能量存儲,實際上也無法實現(xiàn)正常的UPS功能,因此市電-充電模塊-電池也是串聯(lián)的。這樣可以畫出整個UPS系統(tǒng)的可用性串并聯(lián)路徑圖
從這一路徑關系里可以看到,總共存在3條并聯(lián)的路徑,而每一條路徑各自又是由數(shù)個模塊串聯(lián)起來的。正與前面分析的一樣,輔助電源與控制模塊的可用性是串聯(lián)在所有通路上的,因此如果這兩者設計有缺陷的話UPS的可用性是無法做的很高的。電池回路串聯(lián)有最多的模塊數(shù)量,也是可用性最低的一條路徑。
要提升系統(tǒng)的可用性首先要提升關鍵路徑的可用性。從路徑圖上可以看到就是控制模塊與輔助電源。輔助電源是整個UPS的關鍵點,如果輔助電源不工作整個UPS都將癱瘓。提升輔助電源可用性的方式可以有很多種方案:一種是改進設計,提升MTBF;一種是對輔助電源也適用并聯(lián)冗余設計,提升可用性;再一種是對UPS的三條可用性路徑分別使用不同的輔助電源,相當于把原來完全串聯(lián)的路徑改成并聯(lián)。在UPS設計中可以混合使用這幾種方式,由于上面三條可用性通路是并聯(lián)的,而旁路通路本身是可用性最高的一條,因此最為推薦的設計就是優(yōu)先提升旁路的可用性,對旁路單獨使用一套輔助電源供電,并且這套電源的盡量采用簡單的設計,以擁有高的MTBF。
控制模塊同樣也是影響到所有路徑的關鍵點,也必須擁有高的可用性。參照輔助電源的處理方法,也可以給相對獨立的旁路路徑配備單獨的控制模塊,并且通過與其余控制功能協(xié)調(diào)工作來達到高可用性的目的。同樣,旁路上的控制模塊也要盡量簡單,以提升可靠性。一種推薦的做法是旁路控制模塊不斷的檢測UPS主控制模塊的狀態(tài),如果發(fā)現(xiàn)主控制模塊,則自動切換到旁路方式。此外,對于主控制模塊來說也可以通過冗余的方式來提升可用性,比如采用雙MCU結構,當一個MCU檢測到另外一個MCU發(fā)生故障時可以接管另一個MCU的功能,或者采取緊急措施如轉旁路來保證負載不斷電。
[page]
對于UPS來說,電池是保證UPS能夠在市電或者旁路斷電發(fā)生時繼續(xù)維持供電的關鍵,但是串聯(lián)環(huán)節(jié)最多,也恰恰是可用性最為薄弱的環(huán)節(jié)。一般電池規(guī)格書里面會說明充電電流不要超過0.15CC,這就意味著電池在UPS滿載放電放完之后要用數(shù)倍的時間才能重新充滿,從這個意義上講其可用性一般都在20%以下。但是由于電池并不是連續(xù)工作的,只要在電池放完前市電恢復,在重新充電的過程中也沒有再發(fā)生斷電,那么負載仍然不會受到影響。從這方面來看,電池的可用性在只會發(fā)生短時間的斷電情況下還是很高的。
再重新來審視電池回路的可靠性,在電池與市電之間還有一個充電器模塊環(huán)節(jié)。如果充電器損壞則電池在一次放完電之后就無法再充回,導致下一次市電停電時負載斷電。但是充電器只是在電池需要充電時才會工作,因此如果能夠及時對充電器的狀態(tài)進行監(jiān)控,在發(fā)現(xiàn)充電器異常時及時報警,就能夠避免充電器故障帶來的問題,從而提升整個UPS的可用性。對于電池也有一樣的手段。電池在使用多次之后也會面臨容量下降和失效的問題,但是如果能夠通過電池狀態(tài)監(jiān)控發(fā)現(xiàn)電池失效并及時更換,也能夠有效提升UPS的可用性。
UPS系統(tǒng)的可靠性
使用UPS電源系統(tǒng)時,不僅要定期對各主要元件進行檢查,還要對UPS電池組的各個電池單元端電壓與內(nèi)阻進行檢測。若發(fā)現(xiàn)其電池組的某個電池單元的端電壓差值>0.4 V或者內(nèi)阻>0.08Ω的時候,就應該斷開工作異常的電池單元與電池組的連接導線,使用外置的獨立充電器對工作異常的電池單元進行單獨充電,將其充電電壓(對12V蓄電池而言)保持在13.5~13.8 V之間,充電時間控制在10~12h.需要注意的是,UPS電源在使用過程中,電池組內(nèi)的各個電池單元的充電會不一致,可能產(chǎn)生電池單元端電壓以及電池內(nèi)阻的不平衡。這些是無法依靠UPS電源系統(tǒng)內(nèi)部充電回路對其充電而得到消除和校正的,若不及時對不平衡電池單元進行脫機均衡充電的話,可能導致上述問題更加嚴重。
為了解決這一瓶頸,可以在UPS系統(tǒng)中加入一個特性和電池互補的備用電源:在市電斷電時的不需要很快反應,但是在長時間停電條件下能夠持續(xù)提供電力,燃油發(fā)電機組就是最為合適的一個選擇。因此在UPS系統(tǒng)配置上可以加入一個自動切換裝置,在市電停電后切換到發(fā)電機組。這樣一來能夠極大的提升長時間斷電條件下UPS系統(tǒng)的可用性。如此則UPS系統(tǒng)的可用性路徑就成為
雖然在可用性路徑里面多串聯(lián)了一個市電與發(fā)電機切換用的ATS,增加了單調(diào)路徑發(fā)生故障的概率,但是相對長時間斷電帶來的可用性問題來說還是值得的。
在UPS應用的另外一個分支是目前正在興起的直流UPS系統(tǒng)。直流系統(tǒng)的思路是出于提高效率的目的,減少電源系統(tǒng)中間的轉換環(huán)節(jié),電力分配部分由原來的交流轉換成直流。一個理想的直流UPS系統(tǒng)服務器應用從市電到12V終端的應用結構見下圖。
可以看出,理想的直流UPS系統(tǒng)由于把交流系統(tǒng)中UPS的逆變環(huán)節(jié)與服務器電源中的PFC環(huán)節(jié)使用一個隔離型DC/DC環(huán)節(jié)來取代,從而可以改善效率。不過在直流UPS系統(tǒng)里面由于電池電壓的變動范圍是比較大的,為了取得更優(yōu)化的效率曲線,在后級的服務器電源中也有可能使用兩級結構。也就是通過一個簡單的轉換,減小服務器電源隔離DC/DC轉換級的輸入范圍,以得到更好的節(jié)能效果。此時的結構見下圖
在這種直流UPS體系里面,不存在交流UPS中的旁路回路了,只存在一個市電到電池回路,這個回路也兼有充電器的作用。因此從單個UPS的可用靠性角度考慮,直流UPS可靠性鏈路只有兩條,其中一條是兩級變換加上輔助電源與控制板,另外一條是電池,見下圖所示
與交流UPS相比,直流UPS供電少了交流UPS的旁路回路,少了一個提升可用性的回路。但是電池是直接給負載供電的,可用性要高于交流UPS。因此在可用性的方面直流供電系統(tǒng)有得有失。但是另一個方面直流系統(tǒng)比交流UPS更容易進行并聯(lián),從而可以利用增加并聯(lián)臺數(shù)的方式增加可用性。
[page]
配電系統(tǒng)的可用性
對于一般的UPS系統(tǒng)應用來說,存在兩種常見的配置方式,一種是雙機熱備份,見下圖所示
這種配置方式下兩臺UPS是完全并聯(lián)工作的?;谇懊婵捎眯缘脑?,第二種配置方式比第一種會有更高的可用性。
這里就反映了可用性與可靠性的一個明顯不同。對于兩臺并聯(lián)冗余配置的UPS,由于器件多了一倍,那么出現(xiàn)故障的概率也會增高,因此從統(tǒng)計意義上來講整個系統(tǒng)的MTBF會下降。但是由于其中一臺出現(xiàn)故障之后仍然有一臺在工作,只要出故障的UPS能夠很快修復,負載就仍然處在有效的保護之中,可用性是提升的。從負載的角度衡量,評估系統(tǒng)的可用性比可靠性更加有意義。
在可用性的定義中,電源系統(tǒng)恢復的時間越短,則可用性也會越好。因此把電源系統(tǒng)設計為模塊化易更換的結構,可以大大減小維護時間,從而使得可用性顯著改善。
對于機房應用的場合,雙總線的概念應用十分廣泛。對于關鍵的服務器負載,一般都提供兩組電源輸入。相應的,在配電部分就也可以對應采用兩組獨立的電源總線。結合UPS本身就支持雙總線輸入,實際上可以構造出很多種組合形式。對不同方式進行比較后,比較推薦的一種典型的結構見下圖所示
這里把兩組獨立市電都供給兩套UPS系統(tǒng),然后每一套UPS系統(tǒng)作為一條總線來使用,可以充分發(fā)揮市電雙總線,UPS內(nèi)部雙總線以及負載雙總線高可用性的優(yōu)勢。