當2003年5月4日F4龍卷風襲擊了位于田納西州杰克遜的Aeneas互聯(lián)網(wǎng)和電話公司的時候,這家公司的系統(tǒng)被龍卷風刮的凌亂不堪并且拋在了大街上。備份磁帶在暴風雨襲擊4天之后仍然不能回復。然而,由于Aeneas有一個災難恢復計劃,這家公司所有的數(shù)千個客戶在中斷72小時之后都要恢復服務。不過,Aeneas似乎對于這個規(guī)定是一個例外。
PTS數(shù)據(jù)中心解決方案公司總裁Pete Sacco說,真正準備應付災難的中小企業(yè)還不到20%。他們也許會說他們做了準備。這是一個漂亮的口號。如果老板詢問,數(shù)據(jù)中心管理員將有一個“計劃”。但是,在災難襲來的時候,這個計劃就崩潰了。
在IT領域,保護你的服務器是非常重要的。當數(shù)據(jù)中心運行受到威脅或者停止運行并且服務器必須要盡快恢復運行的時候,你的選擇是什么呢?
根據(jù)等級容錯
服務器機房在發(fā)生災難性事件的時候有三種基本的容錯模式:熱容錯、聞容錯和冷容錯。熱容錯包含一個遠程站點,能夠在轉換之后立即接管主數(shù)據(jù)中心。這個備份的站點儲備著服務器、存儲、通訊、備份能力等數(shù)據(jù)中心日常工作所需要的一切東西。還有一個連接到只要站點定期進行同步的安全的廣域網(wǎng)連接。熱站點服務器與主站點服務器并行運行,因此,當發(fā)生容錯時,幾乎不會出現(xiàn)關機時間。然而,熱站點的供電和維護都是非常昂貴的。
溫容錯有熱容錯站點的許多物理設備,但是,不是擁有全部設備。溫容錯站點有服務器機房轉換所需要的全部硬件。然而,這些服務器不是每天24小時運行。因此,在下達容錯指令的時候,一個溫容錯站點開始運行需要幾分鐘至幾個小時的時間。企業(yè)也許喜歡與場地出租提供商簽訂合同作為保持一個熱容錯站點或者溫容錯站點的最節(jié)省成本的方式。此外,只要有硬件和房地產的消費,溫容錯設置仍然包括許多開銷。
冷容錯是通過利用分支機構托管的非生產系統(tǒng)等現(xiàn)有的資源作為“權宜之計”的省錢的方法。當一家企業(yè)實施冷容錯方案時,最新的備份數(shù)據(jù)必須要轉送到冷容錯站點,這比發(fā)送信息的站點要延遲1至2天,除非這個機構把那個分支機構作為自己的安全備份目標。不過,即使當前的數(shù)據(jù)在冷容錯站點,現(xiàn)有的服務器一般都需要遷移自己當前的應用程序或者關閉這些應用程序以便為數(shù)據(jù)中心的應用程序讓路。而且,因為這個分支機構的站點是一個備份的站點,其服務器很可能沒有數(shù)據(jù)中心的服務器那樣強大。如果容錯時間太長,就可能引起問題。
Integrity Computing公司總裁、企業(yè)顧問Ted Udelson說,采用服務器容錯措施,你將有一個恢復時間目標和一個恢復點目標。你需要多長時間回復,你需要在哪一個點上恢復,意味著必須要達到的恢復水平。這將決定你將有一個熱容錯、溫容錯還是一個冷容錯,以及為此計劃的開銷。
Udelson說,如果你的機構沒有合適的分支機構位置,與另一家公司簽署一個互惠合同可以用于冷容錯策略。他列舉了一個非盈利貿易協(xié)會客戶成功地利用與另一家公司簽署的互惠合同的例子。如果發(fā)生災難,每一個組織都可以利用對方的設施,將會的到6個辦公室和足夠的機架式服務器空間以便運行三個或者四個重要任務的服務器。這個機構每天都在這些重要服務器上進行備份,每一個月進行一次全面恢復。你可以把這種做法當作“不冷不熱的容錯”。
[1] [2] 下一頁 |