我的演講題目是關(guān)于運(yùn)維如何從堆積如山的日常工作中解放出來。
我是高效運(yùn)維的發(fā)起人,開放運(yùn)維聯(lián)盟和可信云一樣,我們都是屬于數(shù)據(jù)中心聯(lián)盟底下的組織,作為我們而言是掛靠的關(guān)系,我是高效運(yùn)維社區(qū)以及GOPS發(fā)起人,同時(shí)也是DevOpsDays中國聯(lián)合發(fā)起人。我自己本人2004年開始一直在做這個(gè)行業(yè),目前已經(jīng)創(chuàng)業(yè),做運(yùn)維社區(qū)以及DevOps的事情。我這邊和我的朋友們一起做了一些運(yùn)維的。前兩天剛好是第二個(gè)724運(yùn)維日,騰訊游戲等很多公司都有很多活動(dòng)。我也是國內(nèi)第一個(gè)DevOps Master。高效運(yùn)維社區(qū)是國內(nèi)最大的垂直運(yùn)維社區(qū),致力于運(yùn)維的DevOps轉(zhuǎn)型。我們的公眾號在一年的時(shí)間有188萬人次的訪問,這也是我們感到比較自豪的。最近的兩個(gè)活動(dòng),一個(gè)是728 GOPS全球運(yùn)維大會(huì)·北京站,還有818 DevOpsDays上海站。
運(yùn)維怎么從堆積如山的日常工作中把自己釋放出來,傳統(tǒng)有三招,在這三招之外還有第四招。先看一下傳統(tǒng)三招,第一招是自動(dòng)化,自動(dòng)化的實(shí)現(xiàn)有很多途徑,可以你自己去找?guī)讉€(gè)人,自己去做一個(gè)自動(dòng)化,自己去做一些研發(fā)的產(chǎn)品。第二你也可以去買現(xiàn)成的商業(yè)級的產(chǎn)品,還有一個(gè),你可以既不是買也不是開發(fā),你可以去騰訊藍(lán)鯨,用他們的社區(qū)版去做很多上層的建設(shè)。運(yùn)維自動(dòng)化只能解決部分的問題,第二招是招人,能夠緩解很多壓力,但是招人也比較難。第三招是走人。
對于我們而言,還一個(gè)路子,這個(gè)路子實(shí)際上二十年前就有了,但是我們運(yùn)維局限在自己的視野里,把很多事情忽略掉了,今天可以把這個(gè)事情撿起來看一下。我們自己只有兩只眼睛和兩只手指,運(yùn)維很多時(shí)候的問題在底下,你會(huì)同時(shí)一天做了十件二十件工作。我們是沒辦法去判斷到底是真的重要緊急還是假的重要緊急,它在公司產(chǎn)生的價(jià)值有多大,所以很多時(shí)候決定我們在一個(gè)時(shí)間點(diǎn)做什么,決定誰最著急。這里就會(huì)有很多問題。當(dāng)我們一天要面對很多并發(fā)的時(shí)候,這個(gè)時(shí)候我們怎么做一些這樣的優(yōu)化。這個(gè)議題比較有意思,跟我們平時(shí)技術(shù)的問題關(guān)系不是很大。橫坐標(biāo)如果說是同時(shí)并發(fā)的數(shù)量,縱坐標(biāo)是這兩個(gè)的時(shí)間。第一個(gè)時(shí)間是灰色的,表示我們在每一個(gè)項(xiàng)目或者每一個(gè)任務(wù)上我們的工作時(shí)間,或者說有效時(shí)間。另外一個(gè)是紅色的,因?yàn)槲覀冞M(jìn)行一個(gè)上下文的切換所導(dǎo)致的丟失的時(shí)間。或者簡單說,灰色是代表有效時(shí)間,紅色代表務(wù)要時(shí)間。看一下示意圖,具體情況跟這個(gè)不太一樣,如果說我們在這個(gè)時(shí)刻只是做一件事情,那很明顯,有100%時(shí)間都是有效時(shí)間。如果我們是同時(shí)做兩件事情,這個(gè)時(shí)候的情況就會(huì)不一樣,有效時(shí)間這個(gè)只是40%,新加坡云主機(jī) 香港云主機(jī),另外無效時(shí)間是20%。有人會(huì)問,加起來不是100%,這個(gè)值加起來是100%,因?yàn)槲覀兊倪@個(gè)值是說有一個(gè)任務(wù)的時(shí)間,因?yàn)槟悻F(xiàn)在是有變化兩個(gè)任務(wù),2x40%再加上20%。如果有三個(gè)并發(fā),這個(gè)時(shí)候丟失的時(shí)間或者無效時(shí)間就是有40%了,如果同時(shí)去做5個(gè)任務(wù),這個(gè)時(shí)候?qū)嶋H上我們的無效時(shí)間可能達(dá)到80%。一天工作8小時(shí),你覺得一個(gè)公司能夠創(chuàng)造價(jià)值的工作時(shí)間是多久,會(huì)有4、5個(gè)小時(shí)嗎,沒有,實(shí)際上也就是2、3個(gè)小時(shí)。怎么把并發(fā)的事情去做些優(yōu)化,怎么能夠讓我們的日常工作做一些簡化或者價(jià)值的體現(xiàn),我們可以這樣來看一下。今天時(shí)間有限,實(shí)際上我講的是怎么用精益看板來對我們工作進(jìn)行優(yōu)化,以及讓我們工作的價(jià)值更好的體現(xiàn)出來。
這不是我們獨(dú)創(chuàng)的,是由一個(gè)德國人創(chuàng)造出來的,我們看看他的玩法。這里是一個(gè)小游戲的形式,精益看板一日游。最左側(cè)是需求,ABCDEFG,最往前面的肯定是最緊急的,第一步很重要,第一步的價(jià)值是告訴我們,到底哪些事情要先做,哪些事情要后做,需要排序。以前我們排序往往是無序的排序。第二列是預(yù)備分檢階段。第三個(gè)是開發(fā),第四個(gè)是測試以及發(fā)布。這個(gè)時(shí)候在底下,開發(fā)有2個(gè)團(tuán)隊(duì),測試1個(gè)團(tuán)隊(duì)。什么時(shí)候效率是最高的,當(dāng)這個(gè)團(tuán)隊(duì)一次只做一件事情的時(shí)候,2-2-1是說容量,或者說對于一個(gè)團(tuán)隊(duì)而言,最多他們只能同時(shí)做兩件事情,這個(gè)時(shí)候只有一個(gè)測試團(tuán)隊(duì)。案例是一個(gè)需求,是一個(gè)案例開發(fā)運(yùn)維的階段,我還要再補(bǔ)充一點(diǎn),目前為止,這是一個(gè)通用的,對于我們運(yùn)維而言,很多事情是一個(gè)非計(jì)劃性的工作,這個(gè)事情我們可以新增1個(gè),分配一些人力。目前是這里面的第一頁,剛剛開始的節(jié)奏。這個(gè)人是PO或者叫項(xiàng)目經(jīng)理,他一看,分檢這里面是2,最大可以做2個(gè),一開始是0,他就可以把這兩個(gè)任務(wù)挪過去了。因?yàn)槲覀冇?個(gè)開發(fā)團(tuán)隊(duì),做任務(wù)分解,比如團(tuán)隊(duì)1做A,團(tuán)隊(duì)2做。團(tuán)隊(duì)1和2效率不一樣,這時(shí)候可能團(tuán)隊(duì)1把A已經(jīng)做完了,這個(gè)時(shí)候這個(gè)團(tuán)隊(duì)看到有任務(wù)放到“完成”的階段,這個(gè)時(shí)候他就可以把A由“完成”的狀態(tài)拿到“測試”里面去。但是會(huì)有意外發(fā)生,測試團(tuán)隊(duì)發(fā)生A不能部署,這時(shí)候團(tuán)隊(duì)2剛好把B做完了,這個(gè)時(shí)候我問大家,你覺得這個(gè)時(shí)候團(tuán)隊(duì)2應(yīng)該去做什么。首先作為團(tuán)隊(duì)2而言,他不應(yīng)該去D,這個(gè)時(shí)候2已經(jīng)是最高限了,這個(gè)時(shí)候如果去做D,那意味著是3了。所以他可以一起去修A。因?yàn)閳F(tuán)隊(duì)2和團(tuán)隊(duì)1一樣,都是開發(fā)團(tuán)隊(duì),而且他們可能是有一個(gè)關(guān)系關(guān)聯(lián)的,這個(gè)時(shí)候他們的語言是一致的。因?yàn)檫@個(gè)里面的限制,這個(gè)時(shí)候可能會(huì)有人幫忙。