冷板式液冷占比超八成,浸沒式還有明天嗎?
2023年度液冷基礎(chǔ)設(shè)施市場份額達到61.3%,連續(xù)3年蟬聯(lián)行業(yè)榜首,根據(jù)《液冷數(shù)據(jù)中心白皮書》,曙光數(shù)創(chuàng)再次交出亮眼成績單。
智算快速發(fā)展環(huán)境下,其實不止曙光數(shù)創(chuàng),整個行業(yè)的液冷正呈現(xiàn)高速發(fā)展態(tài)勢。曙光數(shù)創(chuàng)副總裁兼CTO張鵬博士在接受采訪時預測:“液冷整體滲透率目前并不高,不超過10%,但未來3到5年這個比例將快速提高,有望達到30%甚至40%?!薄吨袊豪鋽?shù)據(jù)中心市場深度研究報告》也顯示,目前中國液冷數(shù)據(jù)中心市場快速發(fā)展,預計到2027年,液冷市場將以60%的復合增長率,突破千億規(guī)模。
液冷的兩種主要技術(shù)路線——冷板式與浸沒式的發(fā)展趨勢如何,目前挑戰(zhàn)是什么,如何應對等成為行業(yè)熱議話題。
液冷是高效散熱必需,真正價值是激活芯片計算潛能
大模型等人工智能快速發(fā)展下,智算產(chǎn)業(yè)迅速拓展,據(jù)中國信通院統(tǒng)計,截至2023年底,我國智算規(guī)模約69 EFLOPS,相較于2023年6月的50EFLOPS,半年時間規(guī)模增加38%,但在推動數(shù)據(jù)中心產(chǎn)業(yè)的同時,也給數(shù)據(jù)中心散熱帶來巨大挑戰(zhàn)。
GPU芯片功率不斷提升,高密度成為發(fā)展趨勢。風冷有其制冷極限,無法滿足服務(wù)器及數(shù)據(jù)中心的散熱要求,而同體積液體帶走的熱量是同體積空氣的3000倍以上,能夠高效降溫,保證芯片的安全運行。因此,液冷被公認為是算力基礎(chǔ)設(shè)施的標配與必然選擇。
在此基礎(chǔ)上,液冷應用的成本不斷降低。張鵬表示,經(jīng)過測算,當數(shù)據(jù)中心機架部署密度超過10kW后,冷板式液冷系統(tǒng)的初始投資已經(jīng)低于風冷,并且隨著運行時間的增長,TCO(總體擁有成本)優(yōu)勢會更為明顯。液冷還能夠促進節(jié)能減碳,其高效率制冷的能力可大幅度減少散熱的電能消耗,讓數(shù)據(jù)中心實現(xiàn)低PUE,符合政策要求與綠色化發(fā)展趨勢。
尤為值得注意的是,液冷能夠激活計算的潛能,這也是其真正價值所在。張鵬指出,GPU頻率是可變的,如果制冷能力不足,為了安全穩(wěn)定的運行,GPU就需要降頻,而這就影響了計算能力。換句話說,散熱能力差束縛了芯片算力的輸出。液冷可高效地解決這一問題,確保芯片計算能力的全火力輸出。“以某國產(chǎn)CPU芯片為例,風冷條件下2.4GHz的CPU在相變浸沒液冷環(huán)境下主頻可達到3.2GHz,處理速度提升超過30%!”張鵬說。
這些均推動了液冷應用的快速發(fā)展,行業(yè)客戶逐步增多,包括互聯(lián)網(wǎng)、運營商、金融等,同時,相較于改造,目前液冷的使用主要以新增的數(shù)據(jù)中心為主。張鵬表示,改造面臨很多現(xiàn)實問題,如維保需要結(jié)合數(shù)據(jù)中心現(xiàn)有情況提供更完善的方案,可靠性需進行綜合考量;如服務(wù)器有著一定的使用年限,改造投入后,企業(yè)收益能否覆蓋成本、滿足商業(yè)需要也存在一定疑慮。
冷板式是當前主流,浸沒式未來將廣泛應用
面向大模型的智算需求,為釋放芯片算力,液冷已經(jīng)成為大趨勢。從目前應用情況來看,冷板式是液冷主流。張鵬指出,目前冷板式在液冷市場約占大概80%到90%,這是因為冷板式的成本更低,產(chǎn)業(yè)鏈也更為成熟,同時,冷板式與風冷在運維上差異較小,使用習慣一致,市場接受程度更高。
與之相對應的,浸沒式的運維邏輯不同,比如風冷中沒有換液等運維步驟,考慮到浸沒式的成本與后續(xù)運維,張鵬直言,目前小型數(shù)據(jù)中心不推薦上浸沒式,大型數(shù)據(jù)中心可以承擔較多的成本壓力,還可配置專門的液冷運維操作間,更適宜使用浸沒式。
不過這并不代表浸沒式“止步于此”,伴隨著芯片功率的提升,冷卻效率還要進一步提升,這將推動浸沒式,準確地說是加快相變浸沒式的廣泛應用。
據(jù)了解,國內(nèi)CPU芯片功率已經(jīng)達到400W,而英偉達2024年3月最新推出的B200芯片相比H100雖然算力能源效率提升了約25倍,但芯片功耗也將超過1000W。張鵬表示,相變浸沒式的冷卻效率要高于冷板式與單相浸沒式,更適合高功率的芯片散熱需求,或是終極液冷出路。
不僅如此,相較于冷板式,浸沒式還有多項優(yōu)勢。如浸沒式是一站式解決方案,可靠性高,對環(huán)境的依賴性小,能夠很好的防潮防塵。同時,在服務(wù)器更新的時候,強耦合的冷板式也會被替換,浸沒式則只需要替換冷媒,這使得在成本方面浸沒式也會逐步顯示出優(yōu)勢。
浸沒式應用推廣面臨多項挑戰(zhàn),需要從技術(shù)、生產(chǎn)等方面優(yōu)化
技術(shù)的大規(guī)模應用轉(zhuǎn)化需要成熟的技術(shù)與產(chǎn)業(yè)鏈的支撐,液冷同樣如此。
具體來看,冷板式在技術(shù)上已經(jīng)實現(xiàn)了多項突破,目前面臨的挑戰(zhàn)主要是產(chǎn)業(yè)鏈方面的,包括如何推動產(chǎn)品的成熟,更好的降本增效,提升可靠性等,這意味著整個行業(yè)的發(fā)展,也是挑戰(zhàn)。浸沒式則處于技術(shù)創(chuàng)新突破的時期,其技術(shù)門檻極高,目前依舊有多項技術(shù)問題沒有解決,且并非短時間內(nèi)就可以解決。
這點從曙光數(shù)創(chuàng)的發(fā)展便能體現(xiàn)出來,自2011年提出液冷技術(shù)路線并啟動相關(guān)技術(shù)研究,到2017年浸沒式液冷才對外應用,曙光數(shù)創(chuàng)歷經(jīng)6年才實現(xiàn)了浸沒技術(shù)的商用化,這其中有多項關(guān)鍵技術(shù)的突破。
以浸沒冷媒為例,經(jīng)過長期自主研發(fā),曙光浸沒相變液冷計算機所使用的冷媒——電子氟化液已經(jīng)迭代到第三代,實現(xiàn)了諸多創(chuàng)新,具有高絕緣、低沸點、大潛熱、穩(wěn)定性高、低粘度、安全性、以及環(huán)境友好(無臭氧破壞、溫室效應低)等特性,可支持浸沒相變液冷系統(tǒng)生命周期內(nèi)可靠穩(wěn)定運行。
也正是依托技術(shù)上的長期研發(fā)突破,曙光數(shù)創(chuàng)的相變浸沒液冷才能夠不斷應用推廣,成為目前國內(nèi)唯一實現(xiàn)全浸式液體相變冷卻大規(guī)模商業(yè)化部署的企業(yè),在重慶和多個東部一二線城市均有相變浸沒式數(shù)據(jù)中心的建設(shè)實踐。
面對未來更高功率的散熱要求,針對不同產(chǎn)業(yè)的差異化需求,浸沒式技術(shù)還要進行更深入的發(fā)展,需要企業(yè)從多方面來進行優(yōu)化。
首先,需要大量的研發(fā)投入。以曙光數(shù)創(chuàng)為例,其以技術(shù)為導向,持續(xù)研發(fā)投入,根據(jù)財報來看,2023年研發(fā)投入共計6825.33萬元,2024年第一季度研發(fā)費用總額超1440萬元,相較于2023年第一季度同比增長超過4%。通過大量的研發(fā)投入,曙光數(shù)創(chuàng)有效優(yōu)化了液冷散熱技術(shù),實現(xiàn)了高效可靠的全?;A(chǔ)設(shè)施解決方案全場景覆蓋。截至2023年末,曙光數(shù)創(chuàng)擁有已授權(quán)相關(guān)專利135項,包含發(fā)明專利38項,軟著45項,其中與液冷相關(guān)的專利104項,軟著27項,在審發(fā)明專利31項。
其次,需要為生產(chǎn)做好準備。如曙光數(shù)創(chuàng)在山東青島建設(shè)了目前我國規(guī)模最大的液冷數(shù)據(jù)中心全鏈條產(chǎn)業(yè)創(chuàng)新基地,且已正式投產(chǎn)。該基地囊括研發(fā)、生產(chǎn)和保障三大功能區(qū),擁有七大研發(fā)創(chuàng)新實驗室和四條先進生產(chǎn)線,實現(xiàn)專業(yè)的全鏈條、一站式系統(tǒng)解決方案的創(chuàng)新研發(fā)和生產(chǎn),能夠有效降本增效,提升交付能力,提高保密性,推動生產(chǎn)發(fā)展。
最后,需要時刻跟隨客戶需求。不同的企業(yè)在應用液冷的過程中有差異化需求,如金融業(yè)對安全性的高要求,要求液冷廠商能夠依托自身技術(shù)與產(chǎn)品持續(xù)優(yōu)化發(fā)展,以更契合客戶的發(fā)展需要,促進算力的有效供給。
綜合來看,液冷是智算快速發(fā)展趨勢下散熱的標配與必需品,能夠有效釋放芯片的計算能力,并且伴隨芯片功率的持續(xù)提升,液冷未來的發(fā)展方向是浸沒式,但浸沒式目前在技術(shù)與產(chǎn)業(yè)發(fā)展上依舊存在諸多挑戰(zhàn),需要圍繞客戶需求,加大研發(fā)投入,完善產(chǎn)業(yè)鏈做好生產(chǎn)準備,最終滿足不同客戶對液冷的差異化需求,推動算力建設(shè),加快智能化、數(shù)字化發(fā)