執(zhí)行正確的數(shù)據(jù)中心監(jiān)控程序與保持其完美運行同樣重要。數(shù)據(jù)中心出現(xiàn)的主要問題主要與安全方面和性能有關(guān)。如果您是管理數(shù)據(jù)中心的管理員團隊中的一員,您需要知道數(shù)據(jù)中心的哪些部分需要監(jiān)控。服務器和大型機都值得監(jiān)控和維護。但是,這并不一定意味著您可以忽略數(shù)據(jù)中心上的其他組件。這里有一些技巧可以幫助您監(jiān)控數(shù)據(jù)中心。
為管理員監(jiān)控數(shù)據(jù)中心
監(jiān)控策略
作為管理員,您需要做的第一件事就是選擇監(jiān)控策略。不要掉以輕心,因為它將決定監(jiān)控數(shù)據(jù)中心的下一個程序。為了使數(shù)據(jù)中心的服務器和大型機保持最佳性能,您需要主動移動。這意味著您需要預測與數(shù)據(jù)中心相關(guān)的任何問題,而不是等待它發(fā)生并試圖找到問題的解決方案。您可能對自己能夠處理數(shù)據(jù)中心可能發(fā)生的運營問題充滿信心。通過首先防止它發(fā)生,您將能夠確保您不必為它所困擾。
在監(jiān)控數(shù)據(jù)中心時積極主動肯定不是一件容易的事。為了執(zhí)行這個困難的部分,您需要列出您需要監(jiān)控的任何內(nèi)容。通過收集信息,您將有足夠的數(shù)據(jù)進行分析。它不僅可以讓您預防問題,還可以使您的監(jiān)控程序更加集中。注意數(shù)據(jù)存儲和服務器性能。在您的帳戶中使用網(wǎng)絡(luò),因為它也是數(shù)據(jù)中心的易受攻擊的組件。
選擇工具
在監(jiān)控數(shù)據(jù)中心時,需要工具來處理大型機。作為管理員,您會注意到大型機是存放詳細數(shù)據(jù)的場所。不幸的是,這些數(shù)據(jù)量很大。出于同樣的原因,監(jiān)控大型機被證明具有挑戰(zhàn)性。大多數(shù)大型機專家也提到了同樣的事情。該程序不僅涉及精確性,而且還涉及耐心。在這種情況下,監(jiān)控大型機的適當工具將派上用場。如果您沒有明智地選擇工具,那么這些工具最終可能會適得其反。
一般來說,用于監(jiān)控數(shù)據(jù)中心的工具根據(jù)其功能分為三類。第一個稱為實時監(jiān)視器。顧名思義,它可以在大型機上提供實時視圖。您將能夠看到大型機運行時的進度。第二個工具是近時監(jiān)控。它專門用于調(diào)試大型機上的問題。后處理器是大型機監(jiān)控的最后一個工具。該工具主要用于跟蹤趨勢。它也可以用來幫助您總結(jié)大型機的性能。明智地選擇工具應該可以幫助您更輕松地監(jiān)控大型機。
遠程監(jiān)控
應持續(xù)監(jiān)控數(shù)據(jù)中心。不幸的是,作為人類,您不能一直在數(shù)據(jù)中心工作。輪換制度可能應用于管理團隊交替參與監(jiān)控過程。除了轉(zhuǎn)移您的監(jiān)控任務外,您還可以利用遠程服務器監(jiān)控。通過遠程監(jiān)控服務器,您將能夠查看是否發(fā)生了問題,而無需親自到數(shù)據(jù)中心的位置。以這種速度,您可能會問為什么需要遠程監(jiān)控。遠程監(jiān)控可讓您盡快響應問題。這將使您有時間修復由此造成的更大損害。
有多種工具可用于遠程監(jiān)控數(shù)據(jù)中心。這些工具具有不同的功能。這些工具使您能夠深入了解數(shù)據(jù)中心當前正在發(fā)生的事情。從系統(tǒng)溫度到數(shù)據(jù)存儲的信息都可以遠程監(jiān)控。一些先進的工具將遠程監(jiān)控帶入了更高的水平。它們還提供遠程維護服務器的訪問權(quán)限。盡管能夠在沒有實際存在的情況下監(jiān)控數(shù)據(jù)中心,但這并不一定意味著您可以隨便離開數(shù)據(jù)中心的職責。即使您可以使用遠程監(jiān)控工具,也必須前往數(shù)據(jù)中心。
服務器跟蹤
當您監(jiān)控數(shù)據(jù)中心時,跟蹤服務器是至關(guān)重要的方面。進行此跟蹤的最佳方法是利用每日日志記錄。有關(guān)日志文件的信息很有價值。每個每日日志對應于特定的服務器。如果數(shù)據(jù)中心容納多臺服務器,查看日志文件將是一項艱巨的任務。
在這種情況下,您將需要工具來監(jiān)控數(shù)據(jù)中心上任何服務器的日志文件。由于它與監(jiān)控數(shù)據(jù)中心所需的大多數(shù)工具一起使用,因此提供了用于此目的的工具以及幾個功能。普通工具具有查看日志文件等基本功能。但是,一些用于檢查日志文件的高級工具具有更好的功能。它們包括搜索功能,以查明適合搜索條目的特定日志。此類工具將加快服務器跟蹤過程。
Linux 工具的好處
為了正確執(zhí)行數(shù)據(jù)中心的監(jiān)控,大多數(shù)專家推薦使用 Linux 工具。Linux 的工具配備了幾個有益的功能。這些工具大多適用于監(jiān)控和操作程序。Linux 工具提供的功能之一是能夠定期監(jiān)控系統(tǒng)。來自此監(jiān)控的信息已經(jīng)以可視圖表的形式出現(xiàn)。該圖的最佳之處在于,專家無需通過閱讀該圖即可了解數(shù)據(jù)中心發(fā)生了什么。這樣的開源工具被稱為 Cacti。
除了 Cacti,Nagios 也是推薦的工具,可以免費獲得。強烈建議您監(jiān)控復雜結(jié)構(gòu)的數(shù)據(jù)中心的人員使用。除了系統(tǒng)的溫度,該工具還能夠提供與網(wǎng)絡(luò)流量相關(guān)的信息。不幸的是,在能夠正確執(zhí)行它們的功能之前,您需要先配置這些工具。此配置可能需要一段時間才能完成,但最終它會非常值得?;蛘?,您也可以使用任何其他可以自定義的工具來執(zhí)行您作為管理員的特定需求的特定任務。
監(jiān)控數(shù)據(jù)中心是您作為管理員的主要職責。但是,照顧數(shù)據(jù)中心本身不僅僅是您的工作。IT 部門的其他員工負責確保數(shù)據(jù)服務器正常運行。除了管理,用戶也是其中的重要組成部分。IT 管理主要處理批準或拒絕應用于數(shù)據(jù)中心的更改。同時,用戶有責任報告與性能有關(guān)的任何問題。將進行跟進以解決這些問題。