當您考慮數據中心電源管理的關鍵用例時,您首先想到的可能是能效。畢竟,您越能控制數據中心的能耗,就能節省越多的錢,就能更好地利用現有資源,也能越嚴格地遵守有關 IT 設備安全環境或綠色環保的行業指南數據中心舉措。這就是為什么數據中心監控與設置閾值和發送陷阱、警報和通知的能力相結合對當今的數據中心經理如此有用。
但是,如果您的智能 PDU 無法發送陷阱怎么辦?如果出現網絡或停電怎么辦?這是數據中心中斷的兩個主要原因 ,隨時可能發生。
如果無法連接到數據中心的設備,則很難了解智能 PDU 的狀態。數據中心基礎設施管理 (DCIM) 軟件等工具可以通過對數據中心內的智能 PDU 和其他設備進行健康監控來幫助您解決此類情況。
有哪些不同類型的數據中心健康監控?
DCIM 軟件通過使用 SNMP 或 ICMP 等協議輪詢并從中收集數據來監控數據中心智能 PDU 的健康狀況和狀態。大多數DCIM工具都支持標準的數據輪詢,您可以在其中設置輪詢間隔(例如五分鐘),您的數據中心軟件將以所需的間隔輪詢智能PDU,然后收集并存儲數據。在物理單元中具有內存的智能 PDU 可能能夠在單元本身上存儲數據,這樣您的DCIM 軟件就可以輪詢 iPDU并減少收集數據的頻率,從而減少輪詢頻率并提高網絡流量的效率。如果發生斷電或您失去與 iPDU 的連接,此功能也很有用,因為您可以在必要時稍后收集數據。
除了標準數據輪詢之外,全面的 DCIM 解決方案還將具有健康輪詢。與僅使用標準數據輪詢相比,健康輪詢可以讓您更快地獲取有關 PDU 健康狀況的信息,方法是更頻繁地對 PDU 執行 ping 操作以確保它們可通過網絡訪問。DCIM 軟件可以使用此信息來更新智能 PDU 的健康狀況,并在 PDU 的狀態發生變化時創建事件。
為什么需要數據中心健康輪詢?
當與 DCIM 軟件結合使用時,運行狀況輪詢使您能夠檢查以下內容:
- 為您的智能 PDU 供電。健康輪詢可以幫助您測試您的智能 PDU 是否通電。如果 PDU 沒有電,它在輪詢時不會響應。
- 網絡連接。運行狀況輪詢可以通過檢查 PDU 在網絡上是否可達來幫助您確定是否存在中斷。
- PDU通信。運行狀況輪詢可以通過響應 ping 來幫助您確保智能 PDU 上的通信模塊正常運行。
例如,假設您的數據中心有 500 個機架,每個機架都設置了兩個 iPDU 以實現冗余。如果您丟失了其中一個 PDU,盡管失去了冗余,您可能不會斷電并觸發警報。通過運行狀況輪詢,您的 DCIM 軟件可以每隔一分鐘對數據中心的每個 iPDU 執行一次 ping 操作。然后您會收到 PDU 不可用的警報,并立即采取措施解決這種情況。
使用數據輪詢和健康輪詢的數據中心監控實踐可以有效地關注您環境中的智能 PDU。它通過自動檢查電源、網絡連接和與您的 iPDU 的通信來簡化數據中心電源監控,因此您會在問題成為問題之前迅速收到警報。
下次您在 DCIM 軟件中配置輪詢間隔時,請考慮這種腰帶和吊帶方法如何為您的數據中心的健康提供額外的保護層,并最終幫助您確保正常運行時間和可用性。