在近幾年的國際超級計算機展會上,中國企業憑借豐碩的成果在國際舞臺上贏得了業界的關注和認可。中國的超級計算機也首次在最新的全球超級計算機500強排行榜上以202臺的總數反超了美國,并從2013年開始穩居全球超算速度之首。除了在計算速度上取得的矚目成就,國內企業在商用超級計算機環保節能方面也大放異彩。其中一款備受矚目的“地球數值模擬裝置”來自中科曙光:此裝置運用了我國首款成功商業化的冷板式液冷服務器TC4600E-LP,可以完全模擬地球土壤、海洋和大氣運動變化,同時大幅提升速度、降低能耗,是一臺協助人工智能更進一步的深度學習一體機。該項目在幫助人類社會進一步了解地球環境的同時也做到了服務器全年自然冷卻,可謂在綠色發展道路上邁出了意義非凡的一步。
引領液冷服務器商業化
計算能力的突飛猛進使人工智能在各個行業都具備無限的可能性。大量的計算芯片需要高密度部署,一個服務器機柜的發熱量也將增至數十千瓦。CPU作為服務器的主要驅動力對電源和散熱有著極高的要求——電源系統需要提供更大的功率,冷卻系統也要做到與之相匹配的散熱能力。這是傳統的風冷技術無法達到的。因此,能夠精確到CPU的液冷技術成了曙光節能技術(北京)股份有限公司(以下簡稱曙光節能)主要的研究方向,也是解決目前數據中心節能問題的必然趨勢。相較風冷,液冷能達到更低的PUE值、有效降低風扇噪音和大幅降低耗電量。
雖然液冷技術問世已有一段時間,但囿于技術成熟度和成本等因素,液冷高性能計算機始終未能得到大規模應用。對于習慣運營風冷機房的用戶來說,從風冷到液冷的過度也是一個充滿挑戰的過程。除了服務器架構搭建上的不同,機房的維護方法和程序也需要做出相應的改變。
以此為出發點,曙光節能開始與曙光服務器事業部、上下游廠商合作,致力研發性價比和用戶接受度高的產品,使其滿足科技商業化的必要條件。這一研發項目的成果就是TC4600E-LP冷板式液冷服務器。它采用風冷和液冷混合散熱模式對服務器主要部件進行冷卻,將液冷散熱占比提高至90%以上,從而降低了風機功耗。TC4600E-LP采用了集成管理模塊設計,在整箱刀片式液冷服務器中的CPU芯片和內存上安裝固定水冷板,冷媒通過進出口循環流動。TC4600E-LP投入市場2年來,先后為中科院大氣所“地球數值模擬裝置原型系統”和國家電網電力科學研究院仿真中心超級計算系統項目提供了超過2000節點的計算能力,國內服務器租用 服務器托管,整柜密度超過25kW,空調系統功耗直接降低70%,PUE值始終控制在1.2左右。
冷板式服務器因其對計算機系統較小的改動要求成為液冷技術商業化最合適的選擇,只需將原風冷散熱片替換為液冷板,并將冷媒管路引出機箱即可。快速插拔管路連接也使運行維護更加接近用戶現有的使用習慣,安全便捷。
建設中國HPC生態圈
據曙光節能總經理何繼盛介紹,曙光節能專注于自己的專業領域,其價值在于讓其它應用液冷技術的產業能夠專心鉆研自身的工作,取得經濟與資源上的最高效率。這不僅需要曙光節能本身技術實力雄厚,也需要一個生機盎然的產業生態圈來幫助國內高科技企業實現更快的技術應用和大項目部署。
近年來,曙光節能通過研發制造過程中與上下游合作伙伴的接觸與溝通,將創新鏈與產業鏈結合,深度利用特定的應用進行各類產品的開發和優化。由于國內的HPC產業鏈尚未成熟,曙光節能十分看重上游廠商的研發定制能力,在不同的應用中與供應商進行深入的技術交流,借此希望更多的廠家能在液冷技術配套原材料和零部件研發方面投入更多的精力。
對此,曙光節能液冷系統研發總監崔新濤強調:“液冷系統各個部件都是非常關鍵的,哪個部件出現問題對服務器來說都是致命的影響。正因為有了這些關鍵供應商的支持,才促成這個液冷系統的誕生。”
上游零部件廠商合作:小部件,大作用
在液冷系統的設計中,液冷管路連接是其中重要的一環。機房的空間結構、管路的安全性和易維護性是選擇與設計管路接頭關鍵的考量。崔總監解釋道:“管路接頭是水冷模塊中比較核心的部件,需要保證用戶在使用和維護過程中可以快速插拔,并且冷卻液不泄露。”