最近,超算領(lǐng)域?qū)W術(shù)界和產(chǎn)業(yè)界人士圍繞“中國超算服務(wù)創(chuàng)新”展開了一場熱烈的討論。
起因是,北京并行科技股份有限公司(以下簡稱并行科技)總經(jīng)理陳健從超算建設(shè)投入產(chǎn)出比的角度提出,雖然中國超算近年來取得了矚目的成就,但超算服務(wù)的模式還很落后,特別是一些自建院系、單位級和用戶組級超算集群(統(tǒng)稱為中小微超算),投入產(chǎn)出比遠(yuǎn)不及大型超算,且年平均利用率低,這種“小農(nóng)經(jīng)濟(jì)式”超算服務(wù)形態(tài),虛擬主機(jī),急需改進(jìn)、創(chuàng)新。
如何為科研提供更好的超算服務(wù),是中國超算的一大命題。
陳健提出的解決方案是“超算上云”。作為超算云服務(wù)提供商,陳健認(rèn)為,超算的使用者大都要經(jīng)歷“國內(nèi)外大超算平臺排隊上機(jī)——自建超算集群——租用超算——超算云服務(wù)”的過程,這是一個“從落后的生產(chǎn)力逐漸過渡到更先進(jìn)的生產(chǎn)力形式”。
以此為發(fā)端,超算領(lǐng)域?qū)W術(shù)界、產(chǎn)業(yè)界人士從各個角度給出了他們的理解和思考。
超算“全盤云化”有其局限
之所以以“小農(nóng)經(jīng)濟(jì)”類比,在陳健看來,自建超算集群就好比自種“兩畝自留地”,這些自建的中小微超算有些浪費(fèi),不如大家都把需求集中起來,把無數(shù)的“兩畝地”匯集成“萬畝良田”,大家通過超算云服務(wù)的形式,從大型超算上按需購買計算資源,不但可減少浪費(fèi),還能提高應(yīng)用效率。
相應(yīng)的,陳健把并行科技比作“制造大型農(nóng)機(jī)具的”——只有大型超算(萬畝良田)多了,美國站群服務(wù)器,“現(xiàn)代農(nóng)機(jī)具廠商”才好開張。
但是,超算全部上云(指服務(wù)模式,并非云計算),現(xiàn)實(shí)嗎?
虛擬化和云計算專家麻清剛提出,從技術(shù)上來講,限制超算“上云”的條件是網(wǎng)絡(luò)帶寬。“如果可以以極低成本拉一條400G的網(wǎng)絡(luò)專線,超算還真有可能全盤云化——但不一定都是公有云,私有云、企業(yè)云、行業(yè)云等形態(tài)都可能存在。”
但是,帶寬問題目前很難逾越。“帶寬費(fèi)用是阻礙我們?nèi)?nèi)蒙古建超算的最主要原因,節(jié)約的電費(fèi)都給運(yùn)營商買帶寬去了。”北京大學(xué)高性能計算平臺主任工程師、計算中心系統(tǒng)管理室主任樊春這樣說。
內(nèi)蒙古電價為每千瓦時0.26元。近年來,西部地區(qū)利用“超低電費(fèi)”的條件大力投建IT基礎(chǔ)設(shè)施,這對于一般的云計算中心來說是個利好,但對于超算而言,并不一定可行。
樊春說,對于大部分超算用戶來說,速度和價格是排在前兩位的。超算中心對外提供計算服務(wù),只有同時滿足這兩點(diǎn),用戶才愿意買單。
且不說“拉一條400G的網(wǎng)絡(luò)專線”是個很大的前提,僅超算服務(wù)“全盤云化”這一點(diǎn),中科院計算所研究員、國家超級計算濟(jì)南中心主任張云泉就不太認(rèn)同。
他從超算需求的角度出發(fā),認(rèn)為目前超算云服務(wù)只能支持一些中低端計算需求,那些更快、更大規(guī)模的需求,超算云服務(wù)的形式還提供不了,“就像當(dāng)年網(wǎng)格計算聲稱可全面取代超算一樣,超算服務(wù)全盤云化幾乎不可能”。
超算成本下降還需規(guī)模效益
樊春還提出一個問題:“超算云技術(shù)管理上無法降低成本,從而無法降低對最終用戶的價格,這是超算云發(fā)展的最大障礙。”
這一觀點(diǎn)與陳健提出的觀點(diǎn)相悖。陳健此前在接受《中國科學(xué)報》采訪時稱,超算云服務(wù)商的角色,就是通過研發(fā)軟件和方案,以技術(shù)輸出提高超算集群的易用性和有效利用率,從而降低超算的使用成本——把超算的每核時成本降低至一毛錢。
二者的矛盾點(diǎn)在哪?
一個答案是:用戶規(guī)模。只有用戶規(guī)模上去了,兩人的觀點(diǎn)才能找到平衡點(diǎn)。
一方面,陳健認(rèn)為樊春所在的北京大學(xué)校級高性能計算平臺,已經(jīng)有了足夠大的規(guī)模應(yīng)用,規(guī)模效益已現(xiàn),所以北大能夠給予用戶更低的價格;
另一方面,陳健也深知城域網(wǎng)光纖非常貴——他們就投建了從廣州超算到北京的城域網(wǎng)光纖專線,之所以這么做,是因?yàn)椴⑿锌萍家矊?shí)現(xiàn)了規(guī)模效益,通過這條光纖專線,并行科技有每年數(shù)千萬元的超算云服務(wù)經(jīng)營額。
“這(超大帶寬網(wǎng)絡(luò)光纖)是一個極具規(guī)模效益的基礎(chǔ)設(shè)施投入。”陳健感嘆。
那么,現(xiàn)在中國超算應(yīng)用是否到了產(chǎn)生規(guī)模效益的節(jié)點(diǎn)?