中國IDC圈11月23日報道,11月11日,一個全民狂歡的日子,在無錫召開的HPC China 2015中國高性能計算學(xué)術(shù)年會正式公布了《2015年中國高性能計算機TOP100排行榜》。過去六年一直蟬聯(lián)中國高性能計算機TOP100市場份額第一的中科曙光,在新排行榜中再一次以34%的市場份額高居榜首,應(yīng)用于中科院大氣物理研究所的地球數(shù)值模擬器在年會上大放異彩。
高性能計算一直是曙光專注的資深領(lǐng)域,此前德國ISC大會公布的全球高性能計算500強中,中國科學(xué)院大氣所地球數(shù)值模擬器在TOP500中排名95,而作為"地球數(shù)值模擬裝置"原型系統(tǒng)的助力,曙光旗下國內(nèi)首款可量產(chǎn)化的TC4600E-LP液冷服務(wù)器,今年也再度成為HPC TOP10榜單中的亮點。第十屆中國IDC產(chǎn)業(yè)年度大典(IDCC 2015)即將于2016年1月5日-7日正式開啟,近日百家訪談記者專訪了中科曙光基礎(chǔ)設(shè)施產(chǎn)品事業(yè)部總經(jīng)理沈衛(wèi)東,深入探訪了曙光的服務(wù)器液冷技術(shù)。
沈衛(wèi)東 中科曙光基礎(chǔ)設(shè)施產(chǎn)品事業(yè)部總經(jīng)理
何為液冷服務(wù)器?
近年來,數(shù)據(jù)中心對節(jié)能的需求愈發(fā)顯著。2014年,北京頒布最嚴"限建令",要求新建和擴建數(shù)據(jù)中心PUE必須低于1.5以下。對于不少國內(nèi)數(shù)據(jù)中心PUE設(shè)計值低于1.5,實際運行中卻很難達到的現(xiàn)狀,沈衛(wèi)東表示,按照現(xiàn)有技術(shù),無論是對數(shù)據(jù)中心進行節(jié)能改造,還是提高空調(diào)系統(tǒng)效率,都很難使PUE真正達到1.5以下的水準。這就逼迫數(shù)據(jù)中心行業(yè)必須在服務(wù)器端進行改造,尤其是在服務(wù)器冷卻技術(shù)方面下功夫。
服務(wù)器液冷技術(shù)是與風(fēng)冷相對應(yīng)的概念,它使用液體(通常是水)而不是空氣作為工作物質(zhì),進入服務(wù)器帶走熱量。相比于風(fēng)冷,液冷技術(shù)的優(yōu)勢在于可以顯著地提高服務(wù)器的冷卻效率,提高服務(wù)器的功率密度,減小服務(wù)器的體積,并且能夠改善CPU的散熱效率。目前,服務(wù)器液冷技術(shù)主要分為冷板式與浸沒式兩種,其中冷板式在技術(shù)上相對成熟,應(yīng)用也更廣,而浸沒式冷卻效果更出色,發(fā)展前景更廣闊。
因為冷卻性能出眾,包括曙光在內(nèi)的一些高性能計算廠商很早就開始了對服務(wù)器液冷技術(shù)的研究。在國內(nèi),曙光TC4600E-LP是國內(nèi)第一款正式發(fā)布并量產(chǎn)的刀片式液冷服務(wù)器,目前已在中科院大氣物理研究所交付使用的"地球系統(tǒng)數(shù)值模擬裝置"便是該款服務(wù)器的應(yīng)用案例。該套裝置系統(tǒng)采用冷板式冷卻方式,服務(wù)器約70%的發(fā)熱量使用水作為工作物質(zhì)帶出服務(wù)器,再通過冷卻塔把熱量最終帶到大氣環(huán)境中,而不需要壓縮機和空調(diào)機。這樣做有兩個好處,一是降低了冷卻系統(tǒng)的投資,二是不采用空調(diào)制冷,全年自然冷卻,從而使液冷系統(tǒng)的PUE降低到1.1以下,大大減少了原來空調(diào)系統(tǒng)的制冷功耗。鑒于TC4600E-LP服務(wù)器采用水冷和風(fēng)冷混合冷卻,另外30%的熱量仍需傳統(tǒng)空調(diào)冷卻,平均PUE大致維持在1.2左右。目前來看,這是國內(nèi)液冷服務(wù)器大規(guī)模使用的第一個公開案例,也是PUE水平相對比較低的一個實際案例。
液冷"出彩"在哪里?
沈衛(wèi)東認為,液冷服務(wù)器技術(shù)在業(yè)界頻獲點贊,主要有幾方面的原因。首先是節(jié)能降耗,與風(fēng)冷服務(wù)器相比,液冷服務(wù)器在節(jié)能方面更加優(yōu)秀;其次是提高CPU性能和可靠性,降低CPU的工作溫度,使CPU可靠性提高,同時增強計算性能(如曙光TC4600E-LP與風(fēng)冷版本的產(chǎn)品相比,CPU滿載工作時的核溫降低了20℃,從而使CPU性能提高5%);第三是降低風(fēng)扇和風(fēng)道中產(chǎn)生的風(fēng)噪(冷板式液冷技術(shù)能減少三分之二的風(fēng)扇,而浸沒式技術(shù)則完全不需要風(fēng)扇);第四是能夠進一步提高數(shù)據(jù)中心的功率密度,從而減小機房占地面積(浸沒式液冷服務(wù)器的單機柜功率密度可達200kW, 主機房面積是目前流行設(shè)計的機房面積的四十分之一);第五是數(shù)據(jù)中心設(shè)備投資的降低,這是因為省去了空調(diào)設(shè)備同時服務(wù)器內(nèi)部件也有所減少的緣故。
未來是液冷服務(wù)器的時代
液冷服務(wù)器具有眾多技術(shù)優(yōu)點,究竟何時才能被大眾市場接受呢?沈衛(wèi)東表示,曙光從2012年開始服務(wù)器液冷技術(shù)研究,目前產(chǎn)品化的技術(shù)是冷板式液冷技術(shù),而浸沒式液冷技術(shù)離產(chǎn)業(yè)化還有一段距離。今年九月份曙光發(fā)布國內(nèi)首款量產(chǎn)化的冷板式液冷服務(wù)器TC4600E-LP,可以說2015年是中國"液冷服務(wù)器元年",目前已在地球數(shù)值模擬裝置中布署了上千個刀片節(jié)點。他相信明年將是液冷服務(wù)器在高性能計算領(lǐng)域得到大規(guī)模應(yīng)用的第一年,液冷刀片服務(wù)器將會逐漸替代風(fēng)冷刀片服務(wù)器。至于在非高性能計算領(lǐng)域,沈衛(wèi)東指出,未來曙光將為信息化、互聯(lián)網(wǎng)和云計算應(yīng)用專門開發(fā)機架式液冷服務(wù)器。據(jù)悉目前已經(jīng)處于開發(fā)階段,預(yù)計最快明年會進入量產(chǎn)階段。
展望未來,沈衛(wèi)東認定未來一定會是屬于液冷服務(wù)器的時代。盡管目前液冷服務(wù)器設(shè)備維護性問題、成本優(yōu)化問題都還沒有得到徹底解決,相應(yīng)的機房建設(shè)和運維標準尚未建立,產(chǎn)業(yè)鏈也遠未完善,但這些技術(shù)和市場方面的障礙完全無法阻擋用戶對整個數(shù)據(jù)中心或計算中心更低TCO及更高投資回報率的追求,以及國家政策對節(jié)能減排的更嚴格的要求,因此在大規(guī)模數(shù)據(jù)中心和高性能計算應(yīng)用領(lǐng)域完全替代風(fēng)冷服務(wù)器指日可待。放眼更遠的未來,沈衛(wèi)東更看好浸沒式液冷服務(wù)器,他指出浸沒式服務(wù)器的冷卻效果更好,密度更高,PUE可以降低至1.1以下(冷卻部分甚至可以低至1.01),單機柜功率可達200kW以上,而基礎(chǔ)設(shè)施的成本只有現(xiàn)在的50%.目前,曙光已經(jīng)在提高設(shè)備的易維護性的研究方面取得了階段性進展,且讓我們拭目以待。