中國儲能網(wǎng)訊:隨著人工智能(AI)在綠色低碳領(lǐng)域的迅速發(fā)展和廣泛應(yīng)用,數(shù)據(jù)中心規(guī)模和算力均呈快速增長的趨勢。2024年5月,國務(wù)院將“加快數(shù)據(jù)中心節(jié)能降碳改造”要求列入《2024—2025年節(jié)能降碳行動方案》,被一度視為“電老虎”的數(shù)據(jù)中心將迎來減碳大考。PUE(電能利用效率)作為現(xiàn)階段關(guān)鍵的數(shù)據(jù)中心節(jié)能指標(biāo),在碳中和大環(huán)境下存在哪些局限?數(shù)據(jù)中心減碳的關(guān)鍵在哪里?AI又如何加速數(shù)據(jù)中心的變革升級?
2023年是人工智能發(fā)展的重要轉(zhuǎn)折年,AIGC技術(shù)取得了突破性進展,大模型訓(xùn)練、大模型應(yīng)用等新業(yè)務(wù)正在快速崛起。作為智能算力的載體,數(shù)據(jù)中心也已經(jīng)從數(shù)據(jù)機房、通算中心、云計算中心,發(fā)展到現(xiàn)階段的超算中心和智算中心。據(jù)統(tǒng)計,全國已有超過30個城市正在建設(shè)或提出建設(shè)智算中心,巨大增長的算力需求吸引了眾多企業(yè)進入算力領(lǐng)域,2023年開始我國算力基礎(chǔ)設(shè)施已經(jīng)進入了多樣化發(fā)展的繁榮期。
今年5月,國家數(shù)據(jù)局發(fā)布的《數(shù)字中國發(fā)展報告(2023年)》中顯示,截至2023年底,全國在用數(shù)據(jù)中心機架總規(guī)模已經(jīng)超過810萬標(biāo)準(zhǔn)機架,算力總規(guī)模達到230EFLOPS,居全球第二位,算力總規(guī)模近5年年均增速近30%。
在高質(zhì)量、綠色、可持續(xù)發(fā)展的大前提下,在算電協(xié)同、源網(wǎng)荷儲等大趨勢下,一方面AI等新技術(shù)結(jié)合數(shù)據(jù)中心傳統(tǒng)的BA等系統(tǒng),解決了制冷系統(tǒng)中最佳控制點選擇的問題,可以最大降低40%的制冷能耗。另一方面,AI等高算力需求也帶來高的電力需求,2023年我國在用算力中心總耗電量約為1500億千瓦時,同比增長15%。
如何更好的利用AI去助力實現(xiàn)碳中和,也許應(yīng)該重點關(guān)注能源到算力的轉(zhuǎn)換效率這個指標(biāo)。
1
數(shù)據(jù)中心碳中和更應(yīng)該關(guān)注 IT系統(tǒng)
數(shù)據(jù)中心的碳中和,一定不是使用了100%清潔能源的電中和,一定是整個數(shù)據(jù)中心與外部自然界的中和,其終極目標(biāo)是一個新數(shù)據(jù)中心建成,氣體排放、污染物、碳排放等對當(dāng)?shù)責(zé)o影響,與自然界和諧共處。這不是某個行業(yè)能推動實現(xiàn)的,需要整個數(shù)據(jù)中心產(chǎn)業(yè)上下游形成多行業(yè)聯(lián)動,才能達到這種平衡狀態(tài)。
以節(jié)能為例,數(shù)據(jù)中心前期節(jié)能更多是圍繞基礎(chǔ)設(shè)施建設(shè)和運維開展,以實現(xiàn)降低PUE為目標(biāo)。實際上數(shù)據(jù)中心產(chǎn)業(yè)對碳中和最大的支持不是節(jié)約能耗,而是提升能耗算力的轉(zhuǎn)化效率,這就需要全產(chǎn)業(yè)的支持。
重點應(yīng)該改變的是占比達到80%的 IT 行業(yè),而不是占比只有20%的基礎(chǔ)設(shè)施行業(yè)。由于各種現(xiàn)實原因,相關(guān)行業(yè)自身改變的意愿并不強烈,而相應(yīng)的行業(yè)政策和數(shù)據(jù)中心服務(wù)商也沒有制定相關(guān)鼓勵策略推動這方面的轉(zhuǎn)變。
當(dāng)然,這并不是說PUE不重要。實際上,PUE和能源到算力的轉(zhuǎn)換效率是兩個相輔相成的指標(biāo)。一個高效的數(shù)據(jù)中心應(yīng)該同時追求低PUE和高能源到算力的轉(zhuǎn)換效率。然而,在權(quán)衡這兩個指標(biāo)時,數(shù)據(jù)中心應(yīng)該更加關(guān)注于后者,因為它更直接地反映了數(shù)據(jù)中心在提供計算能力方面的能效。
2
PUE 在碳中和的大環(huán)境下存在局限
PUE作為現(xiàn)階段關(guān)鍵的數(shù)據(jù)中心節(jié)能指標(biāo),并沒有關(guān)聯(lián)到算力輸出上。PUE只是關(guān)注數(shù)據(jù)中心整體能耗與IT設(shè)備能耗之間的比例關(guān)系,而對IT設(shè)備自身的能源轉(zhuǎn)換情況并不掌握。PUE存在更關(guān)注整體、無法體現(xiàn)總電量、無法體現(xiàn)電價、缺少對IT能耗的評價等局限性,無法全面真實的評價數(shù)據(jù)中心綠色節(jié)能情況。
結(jié)合PUE衍生的CUE的定義可能會誤導(dǎo)碳中和重點是利用可再生能源,實際上,碳中和是排放零碳,并不一定要通過使用零碳能源來實現(xiàn),更需要生產(chǎn)方式、生產(chǎn)結(jié)構(gòu)和生產(chǎn)技術(shù)的變革。
從PUE的角度看,數(shù)據(jù)中心基礎(chǔ)設(shè)施自身只消耗1.X中0.X的能耗,隨著PUE越來越小,IT設(shè)備消耗的能耗已超數(shù)據(jù)中心總能耗的75%。公開資料顯示,通用IT設(shè)備耗電97%都轉(zhuǎn)換成了熱能,只有3%真正用于計算,而這部分熱能還需要數(shù)據(jù)中心通過制冷去中和,整個數(shù)據(jù)中心能源到算力的轉(zhuǎn)換效率非常低,現(xiàn)階段數(shù)據(jù)中心產(chǎn)業(yè)雖然在大力推廣液冷等技術(shù),但這些技術(shù)更多是實現(xiàn)如何降低PUE,能源浪費情況仍然存在,因此需要新的指標(biāo)來對能源使用進行綜合評判,數(shù)據(jù)中心在生產(chǎn)側(cè)變革勢在必行。
一個低PUE的數(shù)據(jù)中心可能在能源利用上較為高效,但如果其最終算力輸出不高,那么從整體來看,其在能源方面將比高PUE的數(shù)據(jù)中心更加浪費。
3
能源如何高效的轉(zhuǎn)化為算力才是關(guān)鍵
我們來理解一下能源到算力的轉(zhuǎn)換效率。這個指標(biāo)衡量的是數(shù)據(jù)中心在消耗一定能源的情況下,能夠產(chǎn)生多少有效的算力。提升這一效率意味著在同樣的能源消耗下,數(shù)據(jù)中心可以提供更多的計算服務(wù),或者提供同樣計算服務(wù)的情況下,消耗更少的能源。
*標(biāo)準(zhǔn)的業(yè)務(wù)系統(tǒng)和實際業(yè)務(wù)系統(tǒng)24小時能耗曲線
以業(yè)務(wù)系統(tǒng)為例,從上圖可以看到,多數(shù)業(yè)務(wù)系統(tǒng)在運行時,會更多的關(guān)注負(fù)載均衡、響應(yīng)時間等性能指標(biāo),以及QOS和SLA等商務(wù)指標(biāo),忽視了對能耗的控制,全天每小時的能耗并沒有隨業(yè)務(wù)系統(tǒng)負(fù)載的變化而發(fā)生太大變化。可以通過AI將算力與業(yè)務(wù)動態(tài)的關(guān)聯(lián),提升能源到算力的轉(zhuǎn)換效率。
4
數(shù)據(jù)中心如何借助AI做好提升?
在實現(xiàn)數(shù)據(jù)中心碳中和的過程,除了引入綠色能源、購買CCER等能源側(cè)的變革之外,更應(yīng)該深入開展的是產(chǎn)業(yè)變革、架構(gòu)變革、技術(shù)變革、業(yè)務(wù)變革和運維變革,可以加大對AI等技術(shù)的應(yīng)用。
從移動數(shù)據(jù)中心的實踐看,AI不僅可以結(jié)合BA等系統(tǒng)實現(xiàn)對能源的精準(zhǔn)調(diào)控,還可以助力數(shù)據(jù)中心實現(xiàn)自動駕駛,通過運維自動,5分鐘完成2000機柜巡檢。通過能效自優(yōu),1分鐘內(nèi)從140萬個算法組合中推斷出最佳冷卻策略,實現(xiàn)從制冷到“智”冷。通過運營自治,能夠最大化挖掘資源價值。
從碳中和視角看,數(shù)據(jù)中心園區(qū)應(yīng)該作為一個整體考慮。從土地到建筑再到設(shè)備、從用水到用電再到網(wǎng)絡(luò),整個園區(qū)呼入能源、輸出算力、排放碳和熱。而這個過程中要實現(xiàn)零碳的排放,一方面需要呼入綠色能源,另一方面更應(yīng)該從架構(gòu)上提高基礎(chǔ)設(shè)施、網(wǎng)絡(luò)和IT設(shè)備的能源利用率,提升數(shù)據(jù)中心整體能源到算力轉(zhuǎn)化效率,而不是僅僅降低PUE。
數(shù)據(jù)中心各子系統(tǒng)應(yīng)該作為一個整體考慮,數(shù)據(jù)中心各機房應(yīng)該作為一個整體考慮,數(shù)據(jù)機柜一樣也應(yīng)該作為一個整體考慮,現(xiàn)階段隨著液冷技術(shù)的深入發(fā)展,機柜既服務(wù)器的概念已經(jīng)應(yīng)運而生,IT設(shè)備商將數(shù)據(jù)機柜做為一臺大服務(wù)器去整體設(shè)計,將服務(wù)器內(nèi)配電、制冷和運算整體布局,能極大提升單機柜的效率,既可以提升算力,又可以提升能耗利用率。
數(shù)據(jù)中心實現(xiàn)碳中和是一個長期的過程,不是數(shù)據(jù)中心運營商通過自建、購買綠電等方式簡單實現(xiàn),也不是數(shù)據(jù)中心運營商獨自能實現(xiàn)的。需要從數(shù)據(jù)中心行業(yè)整體思考,通過產(chǎn)業(yè)上下游共同努力,不斷的變革以提升能源到算力的轉(zhuǎn)換效率,并可以借助AI建立類似海綿城市和稻田養(yǎng)魚的自循環(huán)體系,實現(xiàn)數(shù)據(jù)中心和自然的充分融合。