我們首先從騰訊云的布局說起來,這是我在騰訊云官網(wǎng)上下載的我們現(xiàn)在在全球數(shù)據(jù)中心的布點(diǎn)圖,當(dāng)然這里面沒有全部畫全,很多是通過區(qū)域的方式來畫的。簡單來講現(xiàn)在騰訊云超過1000架以上的數(shù)據(jù)中心已經(jīng)超過了50個,這個量是非常大的。在這種時候,我們管理數(shù)據(jù)中心的時候面臨很多挑戰(zhàn),來自多個方面。以前,基礎(chǔ)設(shè)施這側(cè)監(jiān)管還沒報警的時候,業(yè)務(wù)中心找到我們,說我們的數(shù)據(jù)中心超溫了,這種情況我們是想避免的,免備案主機(jī),我們想達(dá)到的理想情況是基礎(chǔ)設(shè)施出了問題,我們可以知會業(yè)務(wù)。這么多數(shù)據(jù)中心不可能全部是騰訊自建的,大部分是租建的,委托給第三方。這種情況下我們怎么去管理第三方?我們怎么知道跟他簽了SLA協(xié)議,他有沒有滿足我們的協(xié)議?數(shù)據(jù)有超溫、漏水的情況他有沒有知會我們?另外很多數(shù)據(jù)中心都會配數(shù)據(jù)中心經(jīng)理管理數(shù)據(jù)中心,他們是跟第三方去合作的,架起第三方和我們騰訊之間的橋梁。這些都是我們在面臨這么多海量數(shù)據(jù)中心的時候面臨到的問題。
標(biāo)準(zhǔn)化之后除了帶來部署這塊的好處,我們也做到了軟件部署模塊化,包括像電池,因?yàn)殡姵毓?jié)數(shù)和點(diǎn)位都是一樣的,只要把這些功能做好了布上去就可以。簡單講這就是騰訊北向接口所帶來的好處,大家如果感興趣可以會后在ODCC的官網(wǎng)上去下載,這個協(xié)議慢慢地我們也看到在向其他行業(yè)去拓展。之前我們也看到一些標(biāo)書,其他行業(yè)在招標(biāo)的時候說要滿足騰訊的北向接口,這對行業(yè)也是一個好處,我的分享就到這里,謝謝大家!
第二個我們就面臨一些協(xié)議適配的問題,現(xiàn)在各家做動環(huán)的也好,做DCM的也好,其實(shí)有很多很多協(xié)議,有各種各樣的協(xié)議,我們到底選哪一種?因?yàn)槲覀兊难邪l(fā)人員也有限,不可能所有協(xié)議全部都去支持和適配。信號點(diǎn)的選擇這也是一個問題。
為了便于大家理解我舉了一個例子,香港服務(wù)器租用,是從北向接口協(xié)議里面扣出來的。這其實(shí)是一個類似電表的,左邊這一列是它的標(biāo)準(zhǔn)信號點(diǎn),也就是說我要去檢測它的點(diǎn)位。有A向電壓、B向電壓、電流、狀態(tài)是閉合還是斷開、功率等等,每一個信號有一個OID上傳。所以當(dāng)廠家跟我們對接好的時候,他傳一個ID,我就知道這個在哪一個點(diǎn)?所以所有設(shè)備我們都規(guī)定了這樣一個ID,是不重復(fù)的,就像每一個信號的身份證一樣。另外我們也規(guī)定了每一個信號小數(shù)點(diǎn)后面的精度是多少,另外它的名字規(guī)定有什么好處?簡單講說騰訊在數(shù)據(jù)中心A和數(shù)據(jù)中心B里面看到的告警描述是一樣的,這樣來講只要是接入這樣的設(shè)備都是標(biāo)準(zhǔn)的,所以這是每項(xiàng)接口的舉例。
另外一個,它說的語言是走SNMP,也規(guī)定了這個微模塊里面有哪些設(shè)備我需要監(jiān)控?每一個要監(jiān)控的設(shè)備到底要去什么點(diǎn)位也是有規(guī)定的,UPS多少條、電表多少條等等。另外一個,每一個信號點(diǎn)位的ID是多少?換句話說,只要在微模塊里面給我一個ID,我就知道這代表哪一個設(shè)備的電壓和電表,我們把每一個ID定義死。基于這樣一套協(xié)議,到目前為止我們已經(jīng)接入了超過1700個微模塊。
下面接下來面臨的一個問題是比如說一個電表或者一個UPS,這么多監(jiān)控點(diǎn)位到底哪些對我來講是有用的?因?yàn)檫@么多數(shù)據(jù)中心,1000個機(jī)架以上的超過50個,海量的數(shù)據(jù)上來,我們要去選哪些點(diǎn)位對我們最有用?我們要把最佳實(shí)踐固定下來。這些所有點(diǎn)位我需要選擇,這是我們要做的第三個事情。