還有DCOM,面向運維、故障的生命周期管理,還有面向整體運營的服務(wù),面向IDC能對外提供服務(wù)的能力,如何保障這些能力低成本達(dá)成,同時跟客戶交互的過程中如何實現(xiàn)盈利,這是我們構(gòu)成面向IDC來說的對應(yīng)管理工具。
1.監(jiān)控管理平臺化,把數(shù)據(jù)都收上來,作為整個數(shù)據(jù)中心基礎(chǔ)設(shè)施運營數(shù)據(jù)的統(tǒng)一匯總平臺,大數(shù)據(jù)的接入平臺,實現(xiàn)基礎(chǔ)實時告警、發(fā)布的樞紐。
我們要知道有多少客戶,客戶的服務(wù)等級、計價方式、定單是什么,客戶跟我們產(chǎn)生的任務(wù)是不是每次都管理起來,持續(xù)高效的實現(xiàn)。另外跟客戶合同條款等級、計價,出賬單,應(yīng)該付多少錢都要清楚。內(nèi)部的賬單,我們在這個客戶身上付了多少成本,收了多少錢,哪個客戶給我提供更大的價值,包括租戶、服務(wù)市場,我能給客戶提供各種服務(wù)能力,客戶能不能在平臺上訂閱服務(wù)、訂閱增值、訂閱每次服務(wù),訂閱服務(wù)以后是不是能形成相應(yīng)的計價、閉環(huán),并且每次服務(wù)是不是真的賺了錢,通過這樣的東西來運營,最終無論是IDC還是工具,最終實現(xiàn)商業(yè)價值的變現(xiàn),數(shù)據(jù)中心持續(xù)的盈利和優(yōu)化,這就是我們今天的匯報。
這是我們給某個客戶做的項目,我們已經(jīng)把前面講到的故障生命周期里的核心模塊做了,除了前面聊到的資產(chǎn)資源能效管理,包括服務(wù)臺、巡檢、故障、變更、服務(wù)等級、維保等等,通過模塊與模塊之間的部署、溝通,實現(xiàn)了整個團(tuán)隊的優(yōu)化。
第三,上架運維指因。
第四個不要一想著上來就做大數(shù)據(jù)分析,首先要把數(shù)據(jù)積累做起來,數(shù)據(jù)的實時性、準(zhǔn)確性、精度做起來,沒有好的數(shù)據(jù)想做相應(yīng)的分析管理,驅(qū)動數(shù)據(jù)運維其實很難。
除了這些以外,今天我們在座的大部分是IDC的朋友,我們看一下IDC還關(guān)心什么,除了讓機(jī)房少出問題、不出問題,我還關(guān)心這個東西是不是能賺錢,跟我的運營有沒有關(guān)聯(lián)。作為運營來說,我們關(guān)心的是對客戶提供的服務(wù),這些服務(wù)是不是低成本獲得、持續(xù)獲得,并且客戶是不是愿意持續(xù)付錢。
第二,容量。
第三關(guān)心容量,關(guān)心自己云資源池情況怎么樣,要加服務(wù)器、應(yīng)用,是不是能合適的加進(jìn)去。我托管給客戶,客戶能不能用容量工具提高租用的模塊,讓客戶更省心、高效。還關(guān)心能效,能源成本占運維成本的50%以上,目前數(shù)據(jù)中心的能效怎么樣?我是不是達(dá)標(biāo)了?是不是達(dá)到了預(yù)期,是不是還有節(jié)能空間。
接下來我們就來拆解里面幾個關(guān)鍵模塊,看一看這里我們做了什么,怎么樣給客戶產(chǎn)生價值。
中國IDC圈訊 12月11日-13日,由中國IDC產(chǎn)業(yè)年度大典組委會主辦,中國IDC圈、CloudBest承辦的以“賦能企業(yè)數(shù)字化轉(zhuǎn)型”為主題的第十三屆中國IDC產(chǎn)業(yè)年度大典(簡稱“IDCC2018”)在北京國家會議中心隆重召開。
無論是IDC運營團(tuán)隊還是IDC的租戶,可以看到租賃區(qū)域和整個IDC整體容量情況,比如說空間使用容量,知道目前每個機(jī)柜裝機(jī)情況,連續(xù)可用空間在哪里,知道電力使用情況,機(jī)柜電用的情況,包括網(wǎng)絡(luò)、承重等等,所有這些因素都可以通過系統(tǒng)來獲得,系統(tǒng)就可以獲得相應(yīng)的維度,這是包括空間、功率、中糧、網(wǎng)口、PDU,所有資源都可以獲得。想獲得對應(yīng)資源維度情況,系統(tǒng)馬上就能告訴你。所以我們需要的是跟數(shù)據(jù)中心、IDC匹配的工具,這幾年我們也發(fā)現(xiàn)了,講到DCIM有些業(yè)主贊不絕口,有些業(yè)主并不覺得發(fā)生了什么價值,更多是噱頭,為什么會產(chǎn)生這樣的情況?
1.無論是北京關(guān)于綠色節(jié)能的政策,還是全國各地鼓勵綠色產(chǎn)業(yè)能效放在了第一位。做好能效要分三步走,第一步要有能效數(shù)據(jù),不知道在座各位IDC從業(yè)者是不是已經(jīng)清楚的知道,機(jī)房的每一度電,每一千瓦消耗在哪里,每個環(huán)節(jié)損耗了多少電,香港服務(wù)器租用,日常的平均值是什么,每月、季度、每年的平均值是什么?是不是符合預(yù)期,不符合預(yù)期問題出在哪里?我相信大家都是很關(guān)心這個問題的。所以第一步我們先要構(gòu)建能效示圖,能知道清晰的知道每一毛錢用在什么地方。
最近我們跟一個運營商溝通,他們想做大數(shù)據(jù)分析,但是機(jī)房里很多數(shù)據(jù)都沒有,這時候就很難做,所以必須把前期做好。
簡單回顧一下,我們幫助數(shù)據(jù)中心,除了把基礎(chǔ)設(shè)施管理起來,上它更節(jié)能、更綠色、更高效以外,讓機(jī)房少出問題、不出問題,這是DCOM的目的,走向整體的盈利,把我們的工具,把IDC從成本中心逐漸走向利潤中心的想法,跟我們這幾年在落地的,現(xiàn)在我們也在做這方面的項目,有些客戶叫三合一系統(tǒng),這是指IT、基礎(chǔ)設(shè)施、業(yè)務(wù),把三塊整合起來變成一個系統(tǒng),這是我們現(xiàn)在在努力的一個方向。
第三個是分期建設(shè),因為不同的時候面對的問題、困難、痛點是不一樣的,不要一次把廠家所有的模塊都布上去,我認(rèn)為這是沒有意義的,可能會造成資源浪費,另外沒想清楚的模塊裝上去不好用,第三你裝上去沒用起來,后面想用的時候發(fā)現(xiàn)跟需求匹配度很低。
每次要做相應(yīng)變動的時候,就告訴系統(tǒng),現(xiàn)在我想干什么事,能不能給我提供相應(yīng)的方案,告訴我這個事應(yīng)該怎么辦,能實現(xiàn)容量最大化的算法。可以通過AI算法做智能匹配,無論是電力上架、機(jī)柜上架,還是兩分配,系統(tǒng)可以做這個事情。通過一整套流程,實現(xiàn)容量最優(yōu)化。
一個機(jī)房里又有電又有空間,空調(diào)沒滿負(fù)荷,但是有些設(shè)備裝不上去,這個矛盾很沖突。我的設(shè)備要放在機(jī)房里,運維人員就不讓放,業(yè)務(wù)人員看到機(jī)房還空著就很不滿意,如果放了,比如說放在沒有電的機(jī)柜上,就跳閘了,如果不放的話會影響賺錢,也不行。
我們做了一些落地項目,這是我們給中國電信做的一套系統(tǒng),就把前面我們聊到的所有特性都在項目里落地了。電信客戶總規(guī)模超過10萬機(jī)架,現(xiàn)在做到二期項目,關(guān)心運維,里面有大量自己的團(tuán)隊,怎么把運維人員日常工作和應(yīng)急工作管理起來,資產(chǎn)有自己的,有客戶托管的,這些資產(chǎn)怎么有效利用,并且能夠持續(xù)工作。
這幾年DCIM的蓬勃發(fā)展,2012年在國內(nèi)被大家廣泛認(rèn)可,到現(xiàn)在我們走過了6個年頭。我們可以看到整個行業(yè)也經(jīng)歷了明顯的三個階段,最早DCIM1.0,就是大的集中監(jiān)控,把機(jī)房里的所有子系統(tǒng)數(shù)據(jù)整合上來,弄更漂亮的界面做展示,很多業(yè)主栽跟頭的時候選擇的是1.0的產(chǎn)品,因為是集成式的,換了個更漂亮的界面就完了。
451Group做了一個調(diào)研,大家真正關(guān)心的是實現(xiàn)什么樣的價值?左邊的圖可以發(fā)現(xiàn),第6級功能是設(shè)施監(jiān)控,我要能把數(shù)據(jù)中心所有設(shè)備信息采集上來,是個基礎(chǔ)功能,所以有些廠家發(fā)現(xiàn)上DCIM是監(jiān)控的升級版。第5級需求談到了對制冷IT設(shè)備運維,把IT需求管理起來,跟制冷系統(tǒng)做匹配。另外關(guān)心資產(chǎn)和容量,在運維的過程中做容量匹配的時候,發(fā)現(xiàn)風(fēng)險是不是得到了管控。左邊這張圖更容易理解,53%的需求是關(guān)于能效和環(huán)境的管理,就是傳統(tǒng)的動環(huán)監(jiān)控。53%在能源和環(huán)境管理方面,9%的需求集中在DC的業(yè)務(wù)規(guī)劃。我們要管好DCIM,做合格的話,除了監(jiān)控以外,我們要把數(shù)據(jù)中心資產(chǎn)、能效匹配,更好的匹配業(yè)務(wù)需求鶴歸華,更好的貼近運維和運營的需求。
6.分析與報告。
會上,共濟(jì)科技DCIM行銷總監(jiān)林德昌為大家?guī)砹恕吨写笮?a href="http://m.qzkangyuan.com/cnidc/idcnews/">IDC的DCIM實踐》的主題演講。以下為演講實錄(未經(jīng)本人核實):
謝謝劉總,謝謝IDC給我們這樣一個交流互動的機(jī)會。下面我跟大家匯報一下這些年我們自己在DCIM方面的應(yīng)用,我們發(fā)現(xiàn)這幾年數(shù)據(jù)中心的建設(shè)非常火熱,這個火熱程度不用我講,從早年大家關(guān)注整體的建設(shè),現(xiàn)在更多的關(guān)注運維和運營,其實關(guān)心的是數(shù)據(jù)中心建完以后什么賺錢,怎么不出問題,怎么少惹麻煩。以前我們總說運維人員就像坐在火山口上的人一樣,不出問題是正常的,出了問題怎么辦?這是大家很關(guān)心的,今天我們就來分享一下這個話題。
最早大家關(guān)心的是人工運維,就是堆人頭,能看到的能解決。后來大家關(guān)注機(jī)房的動態(tài)監(jiān)控,這幾年大家關(guān)心DCIM管理基礎(chǔ)架構(gòu)。我們認(rèn)為DCIM應(yīng)該是實現(xiàn)監(jiān)控分析、基礎(chǔ)設(shè)施的運營狀況和趨勢的前提下,管理好機(jī)房的資源、資產(chǎn)、能效,最終的目的是為了保證可用性的前提,減少浪費,提高效率。
做了這個東西帶來的區(qū)別是什么?以前傳統(tǒng)的方式,通過人工方式查找資源分布,知道每個機(jī)柜的負(fù)載,通過人腦匹配算法來找到匹配空間,手動推著上架。我們問了銀行的機(jī)房經(jīng)理,我有100臺設(shè)備要放到機(jī)房,如果把資源利用率,人工算法算到最好的情況,這個方案要多久?他說大概需要一個月的時間。現(xiàn)在通過系統(tǒng)解放人員,解放流程,提高資源利用率,意味著我們通過工具能節(jié)省成本,擴(kuò)大收益,能讓系統(tǒng)從成本中心逐步走向運維中心。
最近網(wǎng)絡(luò)流行都已經(jīng)很多年了,我們數(shù)據(jù)中心還是很傳統(tǒng)落后的,這里面有大量的矛盾和沖突。比如最典型的IT基礎(chǔ)設(shè)施,和機(jī)房基礎(chǔ)設(shè)施之間的供需脫節(jié),必然會導(dǎo)致大量的成本浪費、沖突和風(fēng)險產(chǎn)生。
今天我們也帶來了系統(tǒng)在外面,大家感興趣的話可以關(guān)注我們,謝謝大家。
2.數(shù)據(jù)本身是很能講故事的,但是這個故事能不能講得通俗易懂,能不能讓每個人了解數(shù)據(jù)背后隱藏的意義?需要通過一道合理高效有序的可視化工具,把數(shù)據(jù)故事更好的表達(dá)出來。
第二個在架構(gòu)的選擇上,我們認(rèn)為選擇的必須是有生命力的產(chǎn)品,而不是簡單的集成方案,所以需要謹(jǐn)慎選擇1.0產(chǎn)品,盡可能選擇2.0、3.0產(chǎn)品,當(dāng)然這跟我們的成熟度、數(shù)據(jù)中心的規(guī)模相關(guān)。
13日上午,IDCC2018分論壇,數(shù)據(jù)中心技術(shù)創(chuàng)新論壇正式召開!本次論壇邀請了行業(yè)內(nèi)知名大咖和技術(shù)專家為大家?guī)懋?dāng)今數(shù)據(jù)中心技術(shù)創(chuàng)新內(nèi)容的分享。
我們講一下DCOM是什么?故障生命周期模型這個就繞不開。這里有事前預(yù)防、日常維護(hù)工作、巡檢工作、硬件預(yù)案,接下來楊老師也會分享應(yīng)急管理。另外事發(fā)高效起來,通過服務(wù)臺能實時跟蹤目前所有的故障,進(jìn)行故障分派。跟蹤好每個故障執(zhí)行,通過故障等級,哪個故障可以通過什么樣的服務(wù)等級響應(yīng),不同的客戶需要通過這樣的時間響應(yīng)優(yōu)先級管理,需要把外包團(tuán)隊管理起來,要完成事后的等級優(yōu)化。
3.0從超大規(guī)模數(shù)據(jù)中心、人工智能、云計算技術(shù)趨勢的快速普及,我們發(fā)現(xiàn)3.0的特點:
我們走訪IDC的一個經(jīng)理,說他們的資產(chǎn)分為財務(wù)資產(chǎn)、業(yè)務(wù)資產(chǎn),需要對整個資產(chǎn)的全生命周期管理,但是目前的資產(chǎn)是靠人工來管的,人工管理的資產(chǎn)對他來說帶來了巨大的工作量。
2.人工智能加大數(shù)據(jù),讓系統(tǒng)更加智能、更加方便。無論是互聯(lián)網(wǎng)公司還是IDC還是運營商,大家都在關(guān)注如何做智能運維。
1.云化,面向云擴(kuò)容有強(qiáng)大的處理能力。
70%的機(jī)房看起來很空,但實際上已經(jīng)滿了,不做新的調(diào)整是裝不了設(shè)備的。回過頭來源看國內(nèi)的機(jī)房,比如說能源類的7千平,1400個柜,我們上機(jī)架的時候整體資源平均利用率只有60%左右,但是這個機(jī)房已經(jīng)用不了了。這是幾億的投資,利用率只有60%,意味著有40%的資源浪費,對機(jī)房的所有者來說是巨大的投資損失。
2.0是平臺化的產(chǎn)品,能具備一定的擴(kuò)展能力,現(xiàn)在需要對應(yīng)的功能模塊,可以快速擴(kuò)展,可以根據(jù)用戶的業(yè)務(wù)需求匹配相應(yīng)的管理模塊。
我們要解決容量問題、資產(chǎn)問題,認(rèn)為需要兩步走。第一步通過智能傳感,讓我實時掌握目前資源的使用情況,這是在電信安裝的場景,在機(jī)柜里會匹配安裝這樣的智能傳感,能實時了解到機(jī)柜里的使用情況,目前機(jī)柜里微環(huán)境的使用情況。第二步就是匹配智能算法,我們通過智能傳感可以獲取到整個數(shù)據(jù)中心NSPC的容量,N是網(wǎng)絡(luò),S是空間、P是能量、C是電力。我把基礎(chǔ)設(shè)施的能力或者容量監(jiān)測起來,就可以知道現(xiàn)在目前用了多少能力。我們對容量進(jìn)行建模,告訴系統(tǒng)整個數(shù)據(jù)中心里面每層樓,每個模塊,每個機(jī)柜,配電的每個環(huán)節(jié)最大的能力值是什么,我知道我的能力上限是哪里,知道目前的負(fù)載是怎么樣的。
2.系統(tǒng),有了這些數(shù)據(jù)給到系統(tǒng),能自動統(tǒng)計處5日平均值、當(dāng)日平均值、7天、每個月、每個季度的平均值,推算出未來的趨勢。
最后聊聊我們的想法,有些業(yè)主說上了DCIM發(fā)現(xiàn)很好用,有些認(rèn)為不好用。我們要給到各位介紹模式的選擇上,不要把DCIM當(dāng)成標(biāo)準(zhǔn)產(chǎn)品,不要想著廠家把標(biāo)準(zhǔn)產(chǎn)品部署在這兒就能做好。DCIM是產(chǎn)品加服務(wù)的模式,也就是說它需要甲方的深度參與,因為誰的腳痛誰知道,道理是一樣的。只有你最清楚團(tuán)隊的情況、能力、瓶頸、痛點,通過你的痛點能夠告訴廠家,廠家才能提供有針對性的解決方案,幫助我們解決對應(yīng)的問題,這是第一個。
新進(jìn)的其實越來越難弄,因為強(qiáng)者恒強(qiáng),做得好的企業(yè)做得好必然有道理,所以可持續(xù)發(fā)展就很重要,大家都在做口碑。我們匹配不同類型的數(shù)據(jù)中心,不同的管理等級,不同的需求,需要匹配不同的東西。我們講到IDC的運維不僅需要DCIM,還需要DCOM,這些是什么?我們做了頂層設(shè)計,來了解一下。
4.助力運維,不僅是發(fā)現(xiàn)問題,還要推動解決問題,并且推動問題的持續(xù)優(yōu)化,另外實現(xiàn)資源的規(guī)劃。現(xiàn)在目前超大規(guī)模數(shù)據(jù)中心都不是一次把一萬個柜建起來,那一期經(jīng)驗?zāi)懿荒苤笇?dǎo)二期,一期數(shù)據(jù)能不能幫助二期避免踩到相同的雷。
我們發(fā)現(xiàn)了這樣一些措施是有效還是無效的時候,就會產(chǎn)生下一步的關(guān)鍵動作,就是第三個模塊節(jié)能控制。我們會驅(qū)動人工或者驅(qū)動自動化工具,去完成相應(yīng)的閉環(huán),真正把能效控制在我們認(rèn)為持續(xù)向目標(biāo)靠近的值,而不是隨機(jī)跳動。
5.做資源規(guī)劃。
通過做相應(yīng)的管理工具,之前在另外一個大會,有個專家講。我們做智能化的運維、無人運維,其實就是革各位專家的命,自我革新。習(xí)大大講話也提到了,我們只有用于自我革命,自我進(jìn)化、自我完善、自我革新、自我提高,我們才能更有生命力。所以在座的各位搞技術(shù)的其實蠻苦的,但是我們可以學(xué)到很多新的知識和挑戰(zhàn),很有樂趣。
對用戶來說,他當(dāng)然希望我花最少的錢獲得最好的服務(wù),比如說托管,要關(guān)心設(shè)備有沒有問題,還要關(guān)心其他的條件能不能滿足需要。對運維團(tuán)隊來說,今天早上王總也談到,我能花錢解決的問題就不是問題,這句話放在運維團(tuán)隊來說不合適。因為運維團(tuán)隊希望花少錢辦大事,這里就必然有一個問題,大量人工的操作,以堆人頭的方式實現(xiàn)運維,就會有大量數(shù)據(jù)的不同步,沒法發(fā)現(xiàn)問題,包括關(guān)鍵流程的缺失,帶來了很大的隱患。
第一,能效。
我們對市場做了了解以后,發(fā)現(xiàn)現(xiàn)階段的DCIM有這樣6個普遍的技術(shù)特點:
3.調(diào)優(yōu),我們里了預(yù)期目標(biāo),到底是什么原因?偏離的時候是因為我們對數(shù)據(jù)中心做了什么樣的調(diào)整?比如說回水溫度調(diào)整,空調(diào)負(fù)載均衡,做了一些調(diào)整之后,是不是能對數(shù)據(jù)中心產(chǎn)生相應(yīng)的,還沒達(dá)到預(yù)期的調(diào)整,通過能效分析就能呈現(xiàn)。
【中國IDC圈原創(chuàng) 未經(jīng)授權(quán)禁止轉(zhuǎn)載】
3.容量掌控,以前在數(shù)據(jù)中心里大家更多關(guān)心的是故障和建設(shè),對容量來說是長期被忽視的要素。數(shù)據(jù)中心里有大量容量,但是容量用不起來,為什么?怎么解決?