從系統(tǒng)可用性的定義可以看出,提高UPS系統(tǒng)可用性有兩個途徑:一是提高系統(tǒng)可靠性,即延長平均無故障時間MTBF,另一途徑則是降低平均故障修復(fù)時間 MTTR。從UPS系統(tǒng)平均故障修復(fù)時間MTTR與UPS系統(tǒng)可用性的關(guān)系可以看出,縮短平均故障修復(fù)時間MTTR對提高系統(tǒng)可用性具有更明顯的作用。
這里通過一個具體的案例詳細(xì)分析平均故障修復(fù)時間MTTR的構(gòu)成。所分析的案例是一臺80kVA的UPS系統(tǒng)。如果這樣的UPS系統(tǒng)發(fā)生故障,通常是需要廠商專業(yè)技術(shù)人員才能進行維修的。對于這樣一個系統(tǒng),眾多廠商紛紛提出了“4小時響應(yīng)”、“24小時修復(fù)”等服務(wù)承諾。但值得注意的是,這些時間并非真正的故障恢復(fù)時間。首先,所謂的“4小時響應(yīng)”,通常僅僅是指廠商方面的工程師在得到用戶的通知到做出上門維修計劃的時間,離真正故障修復(fù)還有相當(dāng)?shù)木嚯x,而“24小時修復(fù)”則會有很多的附加條件,如發(fā)生故障的設(shè)備所在地有無工程師、備件等條件。其實,真正的故障修復(fù)時間與整個故障修復(fù)過程的每個環(huán)節(jié)都有緊密的聯(lián)系。
下面就上述UPS系統(tǒng)故障案例的修復(fù)時間進一步地按實際分段加以詳細(xì)分析時發(fā)現(xiàn),一次故障修復(fù)時間由以下時間段構(gòu)成:
故障報警通知時間。從故障發(fā)生到用戶發(fā)現(xiàn)故障的時間,用T1表示。
廠商反應(yīng)時間。用戶將故障信息反饋給廠商的售后服務(wù)部門,到廠商售后服務(wù)工程師與用戶溝通,做出上門維修計劃的時間,用T2表示。
故障初步判斷時間。廠商售后服務(wù)工程師通過電話等方式與用戶溝通,了解故障現(xiàn)象和故障過程,對故障做出基本判斷的時間,用T3表示。
上門服務(wù)時間。從廠商售后服務(wù)工程師通過電話等方式與用戶溝通對故障做出基本判斷后到上門服務(wù)的時間,用T4表示。
故障排除時間。從廠商售后服務(wù)工程師上門服務(wù),到故障排除的時間,用T5表示。
1.首先來分析第一段時間——故障報警通知時間T1
看起來這段時間應(yīng)該是很短,但是實際上它存在極大的不確定性。首先,由于中、大容量的UPS一般安裝放置在專用的電源機房,由于噪音、安全等原因,電源機房平時一般無人值守。因此,如果UPS發(fā)生故障往往要等到故障產(chǎn)生嚴(yán)重后果后才會被用戶發(fā)現(xiàn),同時,由于UPS系統(tǒng)作為強電設(shè)備,需要具有專業(yè)知識、經(jīng)過專門培訓(xùn)的人員才能進行日常的維護操作,所以在出現(xiàn)故障后也需要專業(yè)人員到現(xiàn)場進行評估、判斷,然后才能進行相應(yīng)的操作,這一因素也制約了故障通知的速度。正是由于上述原因,加上空間距離及專業(yè)知識方面的不確定因素,UPS的故障通知時間T1也就變得具有很大的不確定性,使它可能成為降低系統(tǒng)可用性的一個重要因素。