什么是災(zāi)難恢復(fù)?災(zāi)難恢復(fù)是組織在發(fā)生自然災(zāi)害、網(wǎng)絡(luò)攻擊甚至與 COVID-19 大流行相關(guān)的業(yè)務(wù)中斷等事件后重新獲得對(duì)其 IT 基礎(chǔ)架構(gòu)的訪問權(quán)限和功能的方法。多種災(zāi)難恢復(fù) (DR) 方法可以成為災(zāi)難恢復(fù)計(jì)劃的一部分。DR 是業(yè)務(wù)連續(xù)性的一個(gè)方面。
災(zāi)難恢復(fù)如何工作?
災(zāi)難恢復(fù)依賴于在不受災(zāi)難影響的外部位置復(fù)制數(shù)據(jù)和計(jì)算機(jī)處理。當(dāng)服務(wù)器因自然災(zāi)害、設(shè)備故障或網(wǎng)絡(luò)攻擊而停機(jī)時(shí),企業(yè)需要從備份數(shù)據(jù)的第二個(gè)位置恢復(fù)丟失的數(shù)據(jù)。理想情況下,組織也可以將其計(jì)算機(jī)處理轉(zhuǎn)移到該遠(yuǎn)程位置,以便繼續(xù)運(yùn)營。
有效災(zāi)難恢復(fù)計(jì)劃的 5 大要素
- 災(zāi)難恢復(fù)團(tuán)隊(duì):這個(gè)指定的專家組將負(fù)責(zé)創(chuàng)建、實(shí)施和管理災(zāi)難恢復(fù)計(jì)劃。該計(jì)劃應(yīng)定義每個(gè)團(tuán)隊(duì)成員的角色和職責(zé)。在發(fā)生災(zāi)難時(shí),恢復(fù)團(tuán)隊(duì)?wèi)?yīng)該知道如何與彼此、員工、供應(yīng)商和客戶進(jìn)行溝通。
- 風(fēng)險(xiǎn)評(píng)估:評(píng)估使您的組織面臨風(fēng)險(xiǎn)的潛在危害。根據(jù)事件的類型,制定恢復(fù)業(yè)務(wù)所需的措施和資源的戰(zhàn)略。例如,如果發(fā)生網(wǎng)絡(luò)攻擊,恢復(fù)團(tuán)隊(duì)將采取哪些數(shù)據(jù)保護(hù)措施來應(yīng)對(duì)?
- 業(yè)務(wù)關(guān)鍵資產(chǎn)識(shí)別:良好的災(zāi)難恢復(fù)計(jì)劃包括記錄哪些系統(tǒng)、應(yīng)用程序、數(shù)據(jù)和其他資源對(duì)業(yè)務(wù)連續(xù)性最為關(guān)鍵,以及恢復(fù)數(shù)據(jù)的必要步驟。
- 備份:確定需要備份(或重新定位)的內(nèi)容、應(yīng)該執(zhí)行備份的人員以及如何實(shí)施備份。包括說明備份頻率的恢復(fù)點(diǎn)目標(biāo) (RPO) 和定義災(zāi)難后允許的最大停機(jī)時(shí)間的恢復(fù)時(shí)間目標(biāo) (RTO)。這些指標(biāo)限制了指導(dǎo)選擇構(gòu)成組織災(zāi)難恢復(fù)計(jì)劃的 IT 戰(zhàn)略、流程和程序。組織可以處理的停機(jī)時(shí)間以及組織備份其數(shù)據(jù)的頻率將為災(zāi)難恢復(fù)策略提供信息。
- 測試和優(yōu)化:恢復(fù)團(tuán)隊(duì)?wèi)?yīng)不斷測試和更新其策略,以應(yīng)對(duì)不斷變化的威脅和業(yè)務(wù)需求。通過不斷確保公司準(zhǔn)備好面對(duì)災(zāi)難情況下的最壞情況,它可以成功應(yīng)對(duì)這些挑戰(zhàn)。例如,在規(guī)劃如何應(yīng)對(duì)網(wǎng)絡(luò)攻擊時(shí),組織必須不斷測試和優(yōu)化其安全和數(shù)據(jù)保護(hù)策略,并采取保護(hù)措施來檢測潛在的安全漏洞,這一點(diǎn)很重要。
如何組建災(zāi)備團(tuán)隊(duì)?
無論是從頭開始制定災(zāi)難恢復(fù)策略還是改進(jìn)現(xiàn)有計(jì)劃,組建合適的專家協(xié)作團(tuán)隊(duì)都是關(guān)鍵的第一步。首先是利用 IT 專家和其他關(guān)鍵人員在發(fā)生災(zāi)難時(shí)在以下關(guān)鍵領(lǐng)域提供領(lǐng)導(dǎo):
- 危機(jī)管理:該領(lǐng)導(dǎo)角色啟動(dòng)恢復(fù)計(jì)劃,協(xié)調(diào)整個(gè)恢復(fù)過程中的工作,并解決出現(xiàn)的問題或延誤。
- 業(yè)務(wù)連續(xù)性:監(jiān)督此工作的專家根據(jù)業(yè)務(wù)影響分析確保恢復(fù)計(jì)劃符合公司的業(yè)務(wù)需求。
- 影響評(píng)估和恢復(fù):負(fù)責(zé)這一恢復(fù)領(lǐng)域的團(tuán)隊(duì)在 IT 基礎(chǔ)設(shè)施(包括服務(wù)器、存儲(chǔ)、數(shù)據(jù)庫和網(wǎng)絡(luò))方面擁有技術(shù)專長。
- IT 應(yīng)用程序:此角色監(jiān)控應(yīng)根據(jù)恢復(fù)計(jì)劃實(shí)施哪些應(yīng)用程序活動(dòng)。任務(wù)包括應(yīng)用程序集成、應(yīng)用程序設(shè)置和配置以及數(shù)據(jù)一致性。
雖然不一定是 IT 部門的一部分,但以下角色也應(yīng)分配給任何災(zāi)難恢復(fù)計(jì)劃:
- 執(zhí)行管理:執(zhí)行團(tuán)隊(duì)需要批準(zhǔn)與災(zāi)難恢復(fù)計(jì)劃相關(guān)的戰(zhàn)略、政策和預(yù)算,并在出現(xiàn)障礙時(shí)提供意見。
- 關(guān)鍵業(yè)務(wù)部門:理想情況下,每個(gè)業(yè)務(wù)部門的代表將提供有關(guān)災(zāi)難恢復(fù)計(jì)劃的反饋,以便解決他們的具體問題。
災(zāi)難恢復(fù)的類型有哪些?
企業(yè)可以從多種災(zāi)難恢復(fù)方法中進(jìn)行選擇,或者將幾種方法結(jié)合起來:
- 備份:這是最簡單的災(zāi)難恢復(fù)類型,需要將數(shù)據(jù)存儲(chǔ)在異地或可移動(dòng)驅(qū)動(dòng)器上。但是,僅備份數(shù)據(jù)只能提供最小的業(yè)務(wù)連續(xù)性幫助,因?yàn)?IT 基礎(chǔ)架構(gòu)本身沒有備份。
- 冷站點(diǎn):在這種類型的災(zāi)難恢復(fù)中,組織在第二個(gè)很少使用的設(shè)施中建立基本基礎(chǔ)設(shè)施,為自然災(zāi)害或火災(zāi)后的員工提供工作場所。它可以幫助業(yè)務(wù)連續(xù)性,因?yàn)闃I(yè)務(wù)可以繼續(xù)運(yùn)行,但它不提供保護(hù)或恢復(fù)重要數(shù)據(jù)的方法,因此必須將冷站點(diǎn)與其他災(zāi)難恢復(fù)方法相結(jié)合。
- 熱站點(diǎn):熱站點(diǎn)始終維護(hù)最新的數(shù)據(jù)副本。熱站點(diǎn)的設(shè)置很耗時(shí),并且比冷站點(diǎn)更昂貴,但它們大大減少了停機(jī)時(shí)間。
- 災(zāi)難恢復(fù)即服務(wù)(DRaaS):在發(fā)生災(zāi)難或勒索軟件攻擊時(shí),DRaaS 提供商會(huì)將組織的計(jì)算機(jī)處理轉(zhuǎn)移到其自己的云基礎(chǔ)架構(gòu)中,從而允許企業(yè)從供應(yīng)商的位置無縫地繼續(xù)運(yùn)營,即使組織的服務(wù)器下來了。DRaaS 計(jì)劃可通過訂閱或按使用付費(fèi)模式獲得。選擇本地 DRaaS 提供商有利也有弊:轉(zhuǎn)移到離組織位置較近的 DRaaS 服務(wù)器后延遲會(huì)更低,但如果發(fā)生廣泛的自然災(zāi)害,附近的 DRaaS 可能會(huì)受到同樣的影響災(zāi)難。
- 備份即服務(wù):類似于在遠(yuǎn)程位置備份數(shù)據(jù),通過備份即服務(wù),第三方提供商備份組織的數(shù)據(jù),但不備份其 IT 基礎(chǔ)設(shè)施。
- 數(shù)據(jù)中心災(zāi)難恢復(fù):數(shù)據(jù)中心的物理元素可以保護(hù)數(shù)據(jù)并有助于在某些類型的災(zāi)難中更快地進(jìn)行災(zāi)難恢復(fù)。例如,滅火工具將幫助數(shù)據(jù)和計(jì)算機(jī)設(shè)備在火災(zāi)中幸存下來。備用電源將幫助企業(yè)在停電的情況下航行,而不會(huì)停止運(yùn)營。當(dāng)然,這些物理災(zāi)難恢復(fù)工具都不會(huì)在發(fā)生網(wǎng)絡(luò)攻擊時(shí)提供幫助。
- 虛擬化:組織可以在不受物理災(zāi)難影響的異地虛擬機(jī)上備份某些操作和數(shù)據(jù),甚至是組織整個(gè)計(jì)算環(huán)境的工作副本。使用虛擬化作為災(zāi)難恢復(fù)計(jì)劃的一部分還可以讓企業(yè)自動(dòng)化一些災(zāi)難恢復(fù)過程,讓一切更快地恢復(fù)在線。要使虛擬化成為一種有效的災(zāi)難恢復(fù)工具,數(shù)據(jù)和工作負(fù)載的頻繁傳輸是必不可少的,IT 團(tuán)隊(duì)內(nèi)部就一個(gè)組織內(nèi)有多少虛擬機(jī)正在運(yùn)行的良好溝通也是如此。
- 時(shí)間點(diǎn)副本:時(shí)間點(diǎn)副本,也稱為時(shí)間點(diǎn)快照,在給定時(shí)間制作整個(gè)數(shù)據(jù)庫的副本。可以從此備份恢復(fù)數(shù)據(jù),但前提是副本存儲(chǔ)在異地或不受災(zāi)難影響的虛擬機(jī)上。
- 即時(shí)恢復(fù):即時(shí)恢復(fù)類似于時(shí)間點(diǎn)副本,只是即時(shí)恢復(fù)不是復(fù)制數(shù)據(jù)庫,而是拍攝整個(gè)虛擬機(jī)的快照。
如何規(guī)劃 COVID-19 災(zāi)難恢復(fù)和業(yè)務(wù)連續(xù)性
COVID-19 和由此引發(fā)的全球危機(jī)促使許多公司支持遠(yuǎn)程工作的員工,并迫使組織重新考慮其災(zāi)難恢復(fù)和業(yè)務(wù)連續(xù)性戰(zhàn)略。隨著大流行的發(fā)生,即使只是網(wǎng)絡(luò)中斷也會(huì)對(duì)業(yè)務(wù)產(chǎn)生重大影響。
這里有幾點(diǎn)需要考慮:
- 將傳染病的風(fēng)險(xiǎn)和潛在后果添加到您的災(zāi)難恢復(fù)計(jì)劃中。盡管在全球范圍內(nèi)很少見,但為此類緊急情況制定具體計(jì)劃將有助于確保盡可能順利地處理它們。
- 為人制定計(jì)劃,而不僅僅是技術(shù)。COVID-19 的結(jié)果表明,要讓企業(yè)保持成功,員工需要支持、溝通和資源。計(jì)劃您能夠提供這些元素的方式,即使員工在家工作并且可能對(duì)其正常設(shè)備、網(wǎng)絡(luò)或通信渠道的訪問權(quán)限可能不同或有限。
- 考慮使用其他云和軟件即服務(wù) (SaaS) 解決方案,為遠(yuǎn)程工作提供更高效、更靈活的選擇,并減少對(duì)一個(gè)中央數(shù)據(jù)中心或主要總部的依賴。確保您的計(jì)劃包括 IT 冗余——多個(gè)站點(diǎn)中的多個(gè)系統(tǒng),這樣如果一個(gè)系統(tǒng)受到損害,業(yè)務(wù)仍然可以正常運(yùn)行。
災(zāi)難恢復(fù)軟件有什么好處?
任何組織都不能忽視災(zāi)難恢復(fù)。制定災(zāi)難計(jì)劃(包括有效的災(zāi)難恢復(fù)軟件)的兩個(gè)最重要的好處是:
- 節(jié)省成本:為潛在的破壞性事件做計(jì)劃可以為企業(yè)節(jié)省數(shù)十萬美元,甚至意味著公司在自然災(zāi)害中幸存或倒閉之間的差異。
- 更快的恢復(fù):根據(jù)災(zāi)難恢復(fù)策略和使用的災(zāi)難恢復(fù)工具的類型,企業(yè)可以在災(zāi)難后更快地啟動(dòng)和運(yùn)行,甚至可以像什么都沒發(fā)生一樣繼續(xù)運(yùn)營。