數(shù)字化業(yè)務(wù)流程使中小型企業(yè)、機(jī)構(gòu)和其他組織能夠通過隨時隨地向員工提供應(yīng)用程序并鼓勵持續(xù)協(xié)作來提高生產(chǎn)力。然而,當(dāng)關(guān)鍵任務(wù)應(yīng)用程序出現(xiàn)故障時,所有提高生產(chǎn)力的工作都會停止,所有依賴于該應(yīng)用程序的工作負(fù)載都會停止運(yùn)行。在其他情況下,電子商務(wù)允許小企業(yè)隨時向客戶銷售他們的產(chǎn)品,在某些情況下甚至可以在不同地區(qū)銷售。對于這些企業(yè)來說,停機(jī)也是一個嚴(yán)重的問題。
這種情況使得高可用性 (HA) 托管越來越受到依賴 IT 系統(tǒng)進(jìn)行運(yùn)營、銷售或兩者的中小企業(yè)和機(jī)構(gòu)的歡迎。這些公司無法承受停機(jī)時間,而完全冗余的高可用性系統(tǒng)是防止停機(jī)的最佳方式。
停機(jī)成本
對于那些工作負(fù)載和業(yè)務(wù)流程在線運(yùn)行的人來說,停機(jī)成本可以體現(xiàn)在收入損失和生產(chǎn)力損失方面。而這往往只是成本的開始。每個依賴于在線工作負(fù)載的業(yè)務(wù)流程都在等待;在某些情況下,整個公司可能會陷入停頓。了解 HA 基礎(chǔ)架構(gòu)如何幫助您的業(yè)務(wù)。下載我們的白皮書,了解為什么高可用性很重要——以及如何以可靠且經(jīng)濟(jì)的方式實現(xiàn)它。
聲譽(yù)成本
聲譽(yù)受損也是許多經(jīng)歷停機(jī)的企業(yè)的實際成本。這種成本對于每家公司和情況都是獨(dú)一無二的,并且難以量化,但可能包括當(dāng)前客戶的流失、未來客戶的流失,甚至未來的營銷支出。您的客戶群可能會在停機(jī)時間最短的情況下對應(yīng)用程序或電子商務(wù)商店失去信心,并且任何潛在的新客戶都會有負(fù)面的初次體驗,很可能會轉(zhuǎn)向競爭對手。每一次可能導(dǎo)致客戶失望的銷售都會帶來損害企業(yè)聲譽(yù)的風(fēng)險,無論是通過在線評論、論壇或聊天組中的評論,還是通過口口相傳。
如果停機(jī)給客戶帶來很多問題,并且被媒體報道或在社交媒體上廣泛傳播,則可能需要采取進(jìn)一步行動,從而增加成本。在硬件、軟件和網(wǎng)絡(luò)基礎(chǔ)設(shè)施之間,托管和??交付網(wǎng)站和應(yīng)用程序涉及的組件太多,如果時間足夠長,停機(jī)是不可避免的。客戶傾向于在假設(shè)站點(diǎn)關(guān)閉之前檢查他們的連接,并且可以原諒臨時停機(jī)。
網(wǎng)絡(luò)托管商或其客戶無法部署任何技術(shù)來緩解罕見的、前所未有的事件,例如2016 年 10 月導(dǎo)致美國大部分互聯(lián)網(wǎng)離線的 Dyn 分布式拒絕服務(wù) (DDoS) 攻擊,但當(dāng)他們甚至無法在 Twitter 上抱怨時,您的客戶會原諒您。
使系統(tǒng)重新聯(lián)機(jī)
如果不是聲譽(yù)受損,與停機(jī)相關(guān)的最一致的成本就是使系統(tǒng)重新上線的費(fèi)用。這可能體現(xiàn)在支付給 IT 員工的薪水方面,否則他們將執(zhí)行與發(fā)展核心業(yè)務(wù)相關(guān)的更有價值的任務(wù)。這可能會導(dǎo)致加班或向顧問或服務(wù)提供商支付額外費(fèi)用。無論哪種方式,它都是本可以在其他地方使用的成本。
應(yīng)用程序性能監(jiān)控公司AppDynamics引用了 2016 年的一項研究,該研究估計小型企業(yè)停機(jī)的平均成本為每小時 8,580 美元。雖然不要過度夸大這樣一個抽象數(shù)字很重要,但令人瞠目結(jié)舌的總數(shù)足以說明這一點(diǎn),即對于一般公司,尤其是中小型企業(yè)而言,即使是看似短暫的停機(jī)時間也可能是極其昂貴的。具有高可用性托管的組織通常可以在避免停機(jī)的第一起事件中獲得其 HA 托管投資的全部回報。
高可用性硬件如何防止停機(jī)
在HA 硬件環(huán)境配置中,例如 Liquid Web 使用的高可用性是通過冗余實現(xiàn)的,其中物理服務(wù)器上的所有文件和文件夾都被另一臺物理服務(wù)器鏡像,并在分布式復(fù)制塊設(shè)備中持續(xù)同步。
連接的服務(wù)器被稱為“網(wǎng)絡(luò)集群”。
兩臺服務(wù)器由 Heartbeat 監(jiān)控,該軟件可確保資源可用,以便在必要時發(fā)送消息以啟動故障轉(zhuǎn)移(將流量從一臺服務(wù)器轉(zhuǎn)移到另一臺服務(wù)器的過程)。您的系統(tǒng)位于一個虛擬 IP,該虛擬 IP 在浮動虛擬機(jī) (VM) 上運(yùn)行。如果出現(xiàn)嚴(yán)重的硬件故障,虛擬機(jī)會立即收到 Heartbeat 通知,操作會迅速轉(zhuǎn)移到第二臺冗余物理服務(wù)器,以最大限度地減少中斷。
停機(jī)原因
雖然必須解決導(dǎo)致停機(jī)的硬件和軟件原因,例如服務(wù)器配置、安全漏洞和容量,但無法完全避免一些最常見的停機(jī)原因,例如人為錯誤和硬件故障。但是,可以防止它們立即導(dǎo)致系統(tǒng)故障。硬件和人為因素?zé)o法移除,但完全冗余的系統(tǒng)會保持在線,即使其中之一導(dǎo)致主服務(wù)器脫機(jī)。
系統(tǒng)更新和升級通常需要重新啟動服務(wù)器,這是造成停機(jī)的另一個原因。一些沒有 HA 托管的企業(yè)試圖通過計劃在最佳時間(例如周末)執(zhí)行更新或升級來減輕這種停機(jī)時間的成本。
然而,延遲更新可能會帶來風(fēng)險,尤其是在為修補(bǔ)關(guān)鍵安全漏洞或穩(wěn)定性問題而進(jìn)行更新時,并且讓 IT 員工在周末工作以執(zhí)行對業(yè)務(wù)功能不重要的任務(wù)是一種低效的使用充其量的資源。
抵御停機(jī):選擇高可用性硬件
高可用性系統(tǒng)回避了整個問題,因為更新可以在可用時立即執(zhí)行。冗余服務(wù)器首先更新,當(dāng)它完成該過程并與主服務(wù)器同步時,故障轉(zhuǎn)移過程可以開始,使更新的服務(wù)器成為主服務(wù)器,并釋放尚未更新的服務(wù)器以在其上開始該過程.?掃描漏洞的黑客將找到一個完全更新的系統(tǒng),并可能轉(zhuǎn)向更容易的獵物。需要最大正常運(yùn)行時間的公司,例如那些通過其網(wǎng)站產(chǎn)生收入的公司,應(yīng)該考慮通過投資高可用性硬件環(huán)境來防止停機(jī)。