如果您曾經(jīng)致電 IT 支持,您肯定會被問到“您是否嘗試過將其關閉然后再打開?” 或其變體之一。雖然關閉然后重新打開設備確實可以解決一些故障,但對于大多數(shù)技術問題,選擇的武器是故障排除。通常,故障排除涉及多個步驟,包括研究、頭腦風暴和測試。任何稱職的技術人員都會有他們個人最喜歡的故障排除過程或方法。
故障排除的重要性
現(xiàn)代 IT 系統(tǒng)非常復雜,具有許多部件、接口和依賴項。只有當它們的每個部分都在定義的參數(shù)范圍內起作用時,這些系統(tǒng)才能執(zhí)行它們的任務。這意味著即使任何部分或依賴項中的輕微故障都可能導致整個系統(tǒng)崩潰。因此,每一項技術都需要在某一點或另一個點進行故障排除。
不知道從哪里或如何開始解決技術問題會浪費時間和資源。結構化的故障排除框架可減少解決技術問題所需的時間、提高效率并提高用戶滿意度。另一方面,缺乏故障排除方法會導致延誤并增加技術人員和最終用戶的挫敗感。那么如何進行故障排除呢?
故障排除方法
有許多不同的故障排除方法。每個組織都可能有自己的內部故障排除流程或最適合其工作方式的清單。但是,它們都將在某種程度上類似于以下七步故障排除方法:
1. 找出問題
第一步非常簡單。為了能夠解決問題,首先需要確定問題是什么。幫助技術人員識別問題的是癥狀。但是,不能將癥狀與問題混淆。這些癥狀只是指向潛在的問題。
在此步驟中,技術人員必須記住,大多數(shù)最終用戶并不具備與他們相同的技術知識水平。因此,當用戶發(fā)送支持票時,不應將票上提到的問題視為實際問題。為了準確識別問題,技術人員需要采用系統(tǒng)化的方法來收集盡可能多的信息。
信息收集通常需要提出一系列問題,最終用戶可能會覺得這些問題很煩人,但這是可以快速識別根本原因的重要步驟。即使是問一個簡單的問題,例如問題是影響多個設備還是僅限于單個設備,也會立即消除許多可能的原因。
2. 建立可能原因的假設
此步驟涉及找出癥狀的可能原因。一種常見的做法是列出可能的原因列表,并根據(jù)其發(fā)生的可能性對它們進行排名。第一步收集的信息對于建立可能原因理論通常是無價的。
在處理網(wǎng)絡問題時,OSI 模型是開始尋找可能原因的好地方。從物理層向下移動到應用層,然后再進行備份,有助于技術人員從兩個不同的角度看待問題,從而增加定位可能原因的可能性。
3. 檢驗可能原因的假設
故障排除過程的下一步是測試假設以確認它。如果假設得到證實,技術人員將繼續(xù)進行下一步。另一方面,如果該假設被證明是不正確的,技術人員可以重新訪問第二步或將故障單升級到鏈上。
使用從最基本的原因開始的排除過程來測試可能的原因。例如,如果網(wǎng)絡打印機不工作,第一步是檢查它是否已插入并打開。在檢驗假設時,重要的是不要做出假設或將任何事情視為理所當然。經(jīng)過數(shù)小時的故障排除后發(fā)現(xiàn)問題的原因是微不足道的事情,例如未插電的設備,這將是令人尷尬的。
4. 制定行動計劃并確定潛在影響
一旦假設得到證實,就需要制定行動計劃。這是必不可少的,因為正如我們前面提到的,IT 系統(tǒng)有許多部分和接口,對一個部分的任何更改都可能對其他接口產(chǎn)生無法預料的影響。因此,在進行任何修改或更改之前,技術人員需要確定他們可能對整個系統(tǒng)產(chǎn)生的潛在影響。復雜問題的解決方案應附有詳細的分步文檔以及可能的影響。如果建議的解決方案導致其他問題并且需要回滾系統(tǒng),這將派上用場。
5. 實施計劃或升級
如果步驟 1 到 4 被細致地遵循,那么步驟 5 應該是直截了當?shù)摹5牵瑢崿F(xiàn)通常取決于執(zhí)行操作所需的訪問權限和權限級別。因此,如果技術人員缺乏執(zhí)行整改的權限,則故障單會升級到故障排除鏈。這可能會讓人感到限制,但對于IT 系統(tǒng)的安全性和完整性來說是必要的。
6. 驗證完整的系統(tǒng)功能
此步驟涉及解決技術問題并驗證在此過程中沒有出現(xiàn)新問題。雖然復雜的問題需要仔細檢查,但即使是簡單問題的解決方案也需要伴隨著功能驗證。
例如,在打印機未插電的情況下,僅僅插入打印機并離開是不夠的。畢竟,故障排除過程的目的是恢復全部功能。因此,技術人員必須發(fā)送測試打印并驗證打印機是否確實在打印。
此步驟的第二部分包括應用預防措施(如果適用)。優(yōu)秀技術人員的目標是阻止任何可預防的問題再次發(fā)生。在許多情況下,這包括對最終用戶進行教育或再教育。定期教育與網(wǎng)絡釣魚和惡意軟件等安全相關事件尤其相關。
7. 記錄一切
如上一步所述,優(yōu)秀技術人員的目標是阻止可預防的問題再次發(fā)生。如果它們無法預防,則應該減少解決問題所需的時間。為此,有必要記錄調查結果、解決方案和結果。
良好的文檔有助于技術人員避免返工并在問題再次發(fā)生時節(jié)省時間。甚至應記錄錯誤和失誤,因為它們可以突出現(xiàn)有流程中的差距或導致新的最佳實踐。有趣的是,這種故障排除方法不僅限于解決 IT 問題。它還可以在需要解決問題的場景中找到用途。但是如何使用這種方法來解決業(yè)務問題呢?
故障排除與問題解決
從上述方法可以看出,故障排除是一種結構化的方法來解決問題,其目標是恢復全部功能。另一方面,解決問題被定義為定義問題、確定最佳解決方案并實施解決方案的行為。
盡管定義相同,但故障排除通常適用于故障機器、系統(tǒng)和流程的修復。盡管如此,兩者的特點都是采用邏輯和系統(tǒng)的方法來縮小問題的根源以解決問題,并使產(chǎn)品或過程按預期運行。因此,可以直觀地利用故障排除過程專業(yè)知識來解決其他業(yè)務領域的問題。
在故障排除框架中使用問題解決工具
可以在故障排除框架內使用常見的問題解決工具來構建一個有效的問題解決系統(tǒng),該系統(tǒng)可以解決復雜的問題,尤其是在商業(yè)環(huán)境中。
以下是故障排除框架中使用的問題解決工具的一些示例:
1. 五個為什么
五個為什么是一種常見的問題解決工具,用于確定問題的根本原因。它涉及問“為什么?”這個問題。直到找到問題的根本原因。五個為什么是一個簡單而強大的工具,它有助于消除問題的癥狀以揭示根本原因,以便您可以有效地處理它。
第一步,說明問題。接下來是“為什么?”的問題,例如,“為什么會出現(xiàn)這個問題?” 然后是另外四個“為什么”,直到問題的根本原因被發(fā)現(xiàn)。在故障排除框架中使用的五個為什么技術對于識別問題非常有幫助。這一系列探究性問題使技術人員能夠更深入地研究問題的原因,而不僅僅是解決表面問題。
2. 頭腦風暴
頭腦風暴是大多數(shù)人已經(jīng)使用或至少知道的常用工具。以結構化的方式使用,頭腦風暴有助于在相對較短的時間內產(chǎn)生大量的想法。當需要提出創(chuàng)造性的想法、潛在的問題、原因、潛在的解決方案和實施障礙時,它非常有用。
在這種技術中,沒有任何想法被認為過于狂野或不切實際,也沒有對這些想法的判斷或討論。這使參與者可以自由地提出想法而不受限制,并導致產(chǎn)生大量創(chuàng)意。在故障排除框架中,頭腦風暴有助于列出可能的原因。
3. 流程圖
小的技術問題通常需要小的解決方案。可以通過反復試驗來測試解決方案,尤其是當問題僅限于單個用戶時。然而,試錯并不總是可行的,特別是對于影響許多用戶的更大、更復雜的問題。值得慶幸的是,有一些工具可用于模擬操作并識別潛在影響。流程圖就是這樣一種工具,它可以直觀地呈現(xiàn)活動和決策的順序。
該技術從創(chuàng)建過程的初步圖表開始。然后通過“談論過程”來查看圖表,即描述過程的每個步驟以及信息如何通過它。當需要了解流程或系統(tǒng)的操作時,此工具特別有用。在故障排除框架中,流程圖可用于建立行動計劃并識別潛在影響。
4. 目標網(wǎng)格
正如我們前面提到的,故障排除和解決問題的目的是恢復完整的系統(tǒng)功能。在處理影響業(yè)務目標的大型 IT 項目的某些部分時,可能很難記住所有目標。
目標網(wǎng)格是一種工具,可以幫助您跟蹤更廣泛的業(yè)務目標和功能要求以及任何其他目標。此工具很有用,尤其是在定義所需狀態(tài)時,作為故障排除過程的一部分或旨在實現(xiàn)某些業(yè)務目標的其他工作。
目標網(wǎng)格由一個 2x2 矩陣組成,該矩陣通過對兩個基本問題回答“是”或“否”來構建:
- 你要嗎?
- 你有嗎?
所以,如果你想要某樣東西而你沒有它,那么你就想實現(xiàn)它。如果您想要并擁有它,您的目標就是保存它。如果你有東西但不想要它,你的目標就是消除它。而且,如果您沒有某樣東西并且您不想要它,那么您需要避免它。
通過這種方式,目標網(wǎng)格中填充了以下問題的答案:
- 需要達到什么
- 需要保留什么
- 需要避免什么
- 需要消除什么
目標網(wǎng)格有助于制定組織想要實現(xiàn)的結果、條件和質量的戰(zhàn)略列表。它也可以用來闡明一個行動或一個特定項目的預期結果。
結論
故障排除是您工具包中的一項出色技能。它的應用不僅限于修復故障設備和 IT 系統(tǒng)。這種解決問題的系統(tǒng)方法可用于在任何業(yè)務領域的復雜系統(tǒng)中查找和糾正問題。使用問題解決工具補充故障排除方法是將其應用擴展到大型項目和業(yè)務問題的好方法。