中國儲能網(wǎng)訊:
摘要:隨著人工智能技術(shù)的快速發(fā)展,智能算力需求呈爆發(fā)式增長態(tài)勢,智算中心能耗問題當(dāng)今備受關(guān)注。深入分析了國內(nèi)外智能算力總體情況,探討了人工智能時代智能算力迅猛發(fā)展所帶來的能源消耗急劇增長、能源供應(yīng)不穩(wěn)定以及能源利用效率有待提高等方面的問題,并提出相應(yīng)的對策建議,旨在為應(yīng)對智能算力的能源挑戰(zhàn)提供全面且具有實踐價值的指導(dǎo),促進(jìn)人工智能產(chǎn)業(yè)與能源的可持續(xù)協(xié)調(diào)發(fā)展。
關(guān)鍵詞:人工智能;智能算力;能源消耗
0 引言
2024年底,中央經(jīng)濟(jì)工作會議提出要開展“人工智能+”行動,積極運用數(shù)字技術(shù)、綠色技術(shù)改造提升傳統(tǒng)產(chǎn)業(yè)。隨著以深度求索(DeepSeek)、聊天機(jī)器人模型(ChatGPT)、人工智能(Artificial Intelligence,AI)文生視頻大模型為代表的生成式AI時代的到來,AI技術(shù)在工業(yè)、醫(yī)療、交通、金融等眾多領(lǐng)域得到廣泛應(yīng)用,基于圖形處理器(Graphics Processing Unit,GPU)芯片的智能算力需求呈現(xiàn)出爆發(fā)式增長態(tài)勢[1-2]。從深度學(xué)習(xí)模型訓(xùn)練到復(fù)雜的AI推理任務(wù),智能算力作為支撐AI發(fā)展的核心資源,其重要性不言而喻[3]。然而,智能算力的大幅提升也帶來了嚴(yán)峻的能源挑戰(zhàn)。相關(guān)研究機(jī)構(gòu)預(yù)測,全球數(shù)據(jù)中心的能源消耗將持續(xù)增長,而其中相當(dāng)一部分用于滿足AI訓(xùn)練和推理任務(wù)的算力需求[4]。如何在滿足AI發(fā)展需求的同時實現(xiàn)能源的高效可持續(xù)利用,已成為亟待解決的問題。本文梳理分析了全球智能算力發(fā)展的現(xiàn)狀,探討了智能算力激增可能帶來的智算中心能耗上升、能源成本持續(xù)攀升、能源效率有待提升以及能源供應(yīng)穩(wěn)定性要求高等方面的挑戰(zhàn),并基于挑戰(zhàn)提出推動政策支持與產(chǎn)業(yè)協(xié)同降耗增效、加強技術(shù)創(chuàng)新研發(fā)、優(yōu)化能源精細(xì)管理等方面的對策建議,旨在充分發(fā)揮AI正面效應(yīng),有效應(yīng)對AI時代的能源需求。
1 國內(nèi)外智能算力發(fā)展總體情況
1.1 全球算力規(guī)模快速增長,智能算力國際競爭日益激烈
近年來,全球算力總體規(guī)模呈現(xiàn)快速增長趨勢。據(jù)統(tǒng)計,截至2023年底,全球算力總規(guī)模達(dá)到910 EFLOPS,同比增長40%,增長態(tài)勢顯著[5]。其中,通用算力規(guī)模為551 EFLOPS,智能算力規(guī)模為335 EFLOPS,超算算力規(guī)模為24 EFLOPS。與此同時,全球智能算力需求隨著非結(jié)構(gòu)化數(shù)據(jù)(文字、圖片、語音、視頻等)急劇擴(kuò)增呈現(xiàn)持續(xù)增長態(tài)勢?!吨袊懔Πl(fā)展報告》數(shù)據(jù)顯示,截至2023年底,全球智能算力規(guī)模同比增長超過一倍,其增速遠(yuǎn)超算力總規(guī)模增速,智能算力逐漸占據(jù)重要地位[6]。
隨著AI技術(shù)的發(fā)展,全球各國對智能算力的重視程度不斷提高,紛紛加大在智能算力基礎(chǔ)設(shè)施建設(shè)、AI芯片研發(fā)等方面的投入,智能算力的國際競爭日益激烈[7]。美國在智能算力領(lǐng)域處于領(lǐng)先地位,擁有強大的技術(shù)實力和產(chǎn)業(yè)基礎(chǔ),如谷歌、微軟、亞馬遜等在AI研發(fā)和應(yīng)用方面投入巨大,推動了智能算力的快速發(fā)展。例如,谷歌的TPUS等專用芯片為AI訓(xùn)練和推理提供了高效的算力支持。歐洲也在積極推進(jìn)智能算力的發(fā)展,如英國發(fā)布了《國家人工智能戰(zhàn)略》,旨在提升英國在AI領(lǐng)域的競爭力,包括加強智能算力基礎(chǔ)設(shè)施建設(shè)。日本在智能算力的發(fā)展上注重與本國產(chǎn)業(yè)的結(jié)合,如在制造業(yè)、醫(yī)療等領(lǐng)域應(yīng)用智能算力提升生產(chǎn)效率和醫(yī)療服務(wù)質(zhì)量。此外,日本的科技企業(yè)在AI芯片和機(jī)器人等領(lǐng)域也具有一定的技術(shù)優(yōu)勢。
1.2 我國穩(wěn)步推進(jìn)算力設(shè)施建設(shè),智能算力市場爆發(fā)式增長
近年來,我國政府出臺了包括規(guī)劃引導(dǎo)數(shù)據(jù)中心建設(shè)、支持AI芯片研發(fā)等一系列支持智能算力發(fā)展的政策。例如,工業(yè)和信息化部為促進(jìn)計算、網(wǎng)絡(luò)、存儲和應(yīng)用協(xié)同創(chuàng)新,出臺了《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計劃》,旨在構(gòu)建全國樞紐、區(qū)域中心、本地邊緣協(xié)同發(fā)展的多層次算力基礎(chǔ)設(shè)施體系,提升算力高效運載能力,推動算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展,同時提出2025年我國智能算力達(dá)到105 EFLOPS、智算比例達(dá)到35%的目標(biāo)。此外,我國在芯片設(shè)計與制造、服務(wù)器生產(chǎn)、數(shù)據(jù)中心運營、AI軟件開發(fā)、生成式AI、大模型訓(xùn)練以及多模態(tài)AI等多環(huán)節(jié)的智能算力產(chǎn)業(yè)生態(tài)正在逐步完善,且發(fā)展速度迅猛,成為推動國家智能算力增長的主要驅(qū)動力。
截至2023年底,我國在用數(shù)據(jù)中心標(biāo)準(zhǔn)機(jī)架超過810萬架,算力總規(guī)模近5年年均增速近30%,位居全球第2位,達(dá)到230 EFLOPS,是2020年的3倍[5]。與此同時,隨著AI應(yīng)用的快速發(fā)展,中國智能算力市場迎來爆發(fā)式增長。根據(jù)工業(yè)和信息化部的公開數(shù)據(jù),截至2024年底,我國智能算力規(guī)模達(dá)到90 EFLOPS,占比達(dá)到算力總規(guī)模的32%。同時,相關(guān)研究也表明,2024年中國智能算力市場規(guī)模突破190億美元,同比增長86.9%,這一增長趨勢進(jìn)一步表明我國在AI領(lǐng)域的強大實力和國際競爭力。
2 智能算力帶來的能源挑戰(zhàn)
2.1 能耗急劇增長,成本持續(xù)攀升
能源消耗急劇增長。一方面數(shù)據(jù)中心能耗日益凸顯。數(shù)據(jù)中心作為智能算力的主要承載平臺,近年來其能源消耗呈現(xiàn)出驚人的增長速度。據(jù)統(tǒng)計,全球數(shù)據(jù)中心的電力消耗已占到全球總電力消耗的約1%~2%,并且這一比例還在不斷上升[8]。以大型互聯(lián)網(wǎng)企業(yè)和科技公司為例,其數(shù)據(jù)中心的規(guī)模不斷擴(kuò)大,服務(wù)器數(shù)量成千上萬,為了維持這些服務(wù)器的持續(xù)運行以及冷卻設(shè)備的正常工作,需要消耗大量的電能。例如,某知名科技公司的數(shù)據(jù)中心每年的電費支出高達(dá)數(shù)億元,而這僅僅是一個企業(yè)的數(shù)據(jù),全球范圍內(nèi)眾多數(shù)據(jù)中心的能耗總和更是驚人。另一方面,AI訓(xùn)練與推理能耗較高。在AI訓(xùn)練過程中,尤其是深度學(xué)習(xí)模型的訓(xùn)練,需要大量的計算資源來處理海量的數(shù)據(jù)。例如,訓(xùn)練一個大型的語言模型(如GPT-3),其參數(shù)量達(dá)到1 750億,訓(xùn)練過程需要在強大的GPU集群上運行數(shù)周甚至數(shù)月,消耗的電能極為可觀[9]。而在AI推理階段,隨著AI應(yīng)用的廣泛部署,大量的設(shè)備和終端需要實時進(jìn)行推理計算,這也導(dǎo)致了能源消耗的持續(xù)增加。例如,在智能安防領(lǐng)域,大量的攝像頭需要對視頻圖像進(jìn)行實時分析和識別,這需要邊緣計算設(shè)備具備一定的算力,而這些設(shè)備的持續(xù)運行也消耗了大量的能源。
能源成本持續(xù)攀升。智能算力的提升直接導(dǎo)致能源消耗量的增加,進(jìn)而使能源成本成為企業(yè)和機(jī)構(gòu)部署AI解決方案時不可忽視的重要因素。對于大型科技企業(yè)而言,數(shù)據(jù)中心的電費支出已占據(jù)運營成本的相當(dāng)大比例。以某知名互聯(lián)網(wǎng)公司為例,其數(shù)據(jù)中心每年產(chǎn)生巨額度的電費支出,并且隨著 AI 業(yè)務(wù)的拓展和算力需求的增長,能源成本還在持續(xù)上升。對于中小企業(yè)和新興的AI創(chuàng)業(yè)公司來說,高昂的能源成本更是可能成為限制其發(fā)展的瓶頸。除了電費本身,為了保障數(shù)據(jù)中心的穩(wěn)定運行,還需要投入大量資金用于建設(shè)備用電源系統(tǒng)、冷卻系統(tǒng)等基礎(chǔ)設(shè)施,以及支付相應(yīng)的維護(hù)費用,這些都進(jìn)一步加重了企業(yè)的能源成本負(fù)擔(dān)。
2.2 能源利用效率有待提升
服務(wù)器利用率不均衡。在許多數(shù)據(jù)中心,服務(wù)器的利用率存在不均衡的現(xiàn)象。部分服務(wù)器可能長期處于高負(fù)載運行狀態(tài),而另一部分服務(wù)器則處于閑置或低負(fù)載狀態(tài)。這種不均衡的利用率導(dǎo)致了能源的浪費。例如,在一些傳統(tǒng)的企業(yè)數(shù)據(jù)中心,由于缺乏有效的資源調(diào)度和管理機(jī)制,服務(wù)器的平均利用率可能僅為10%~20%,這意味著大量的能源被消耗在維持這些低效運行的服務(wù)器上,而沒有得到充分的利用[10]。
冷卻系統(tǒng)的能源浪費。數(shù)據(jù)中心的冷卻系統(tǒng)是能源消耗的大戶之一,通常占數(shù)據(jù)中心總能耗的30%~40%[10]。為了確保服務(wù)器在合適的溫度下運行,數(shù)據(jù)中心需要采用高效的冷卻技術(shù)。然而,目前許多數(shù)據(jù)中心的冷卻系統(tǒng)存在能源浪費的問題。例如,一些傳統(tǒng)的冷卻系統(tǒng)采用的是風(fēng)冷技術(shù),其冷卻效率較低,需要消耗大量的電能來驅(qū)動風(fēng)扇和空調(diào)設(shè)備。此外,數(shù)據(jù)中心內(nèi)部的氣流組織不合理也可能降低冷卻系統(tǒng)的效率,部分區(qū)域出現(xiàn)過冷或過熱的現(xiàn)象,進(jìn)一步增加了能源的消耗。
2.3 能源供應(yīng)穩(wěn)定性要求高
數(shù)據(jù)中心要求較高的電力供給系統(tǒng)。為了保證服務(wù)器的正常運行和數(shù)據(jù)的安全,數(shù)據(jù)中心通常需要不間斷供電。一旦發(fā)生斷電或波動,可能會導(dǎo)致服務(wù)器宕機(jī)、數(shù)據(jù)丟失等嚴(yán)重后果。因此,數(shù)據(jù)中心常設(shè)有包括市電、備用發(fā)電機(jī)、不間斷電源(Uninterruptible Power Supply,UPS)等在內(nèi)的復(fù)雜供電系統(tǒng)。但隨著數(shù)據(jù)中心規(guī)模越來越大,算力需求越來越大,對電力供應(yīng)穩(wěn)定性的要求也日益提高。部分地區(qū)由于電網(wǎng)基礎(chǔ)設(shè)施老化或電力供應(yīng)能力不足,導(dǎo)致數(shù)據(jù)中心運行風(fēng)險加大,數(shù)據(jù)中心高負(fù)荷用電需求難以滿足[11]。
可再生能源供應(yīng)的間歇性帶來挑戰(zhàn)。許多數(shù)據(jù)中心為了減少對傳統(tǒng)化石能源的依賴,開始嘗試采用太陽能、風(fēng)能等可再生能源。但可再生能源的供給是間斷性的,而且存在不穩(wěn)定性。例如,受天氣和晝夜變化的影響,以及風(fēng)力資源的分布和強度的影響,太陽能發(fā)電和風(fēng)能發(fā)電的供給與需求之間存在著諸多不確定性,難以保證穩(wěn)定可靠的能源供給。數(shù)據(jù)中心在可再生能源供給不足的情況下,需要依賴傳統(tǒng)的能源供應(yīng)來補充電力缺口,使得能源供應(yīng)系統(tǒng)的復(fù)雜性和管理難度大大增加。與此同時,大規(guī)模接入可再生能源也可能對電網(wǎng)穩(wěn)定性造成影響,儲能和智能電網(wǎng)等技術(shù)問題也將成為未來亟需攻關(guān)的重點領(lǐng)域[12]。
3 應(yīng)對智能算力能源挑戰(zhàn)的建議
3.1 政策支持與產(chǎn)業(yè)協(xié)同降耗增效
加強政策與資金支持。出臺一系列優(yōu)惠政策,對采用高效節(jié)能技術(shù)和設(shè)備的數(shù)據(jù)中心給予稅收減免、財政補貼等,以提升智算中心能源利用效率。與此同時,鼓勵智算中心參與電力市場交易,通過與電網(wǎng)簽訂直購電協(xié)議,降低用電成本[13]。此外,政府還可以加大對可再生能源發(fā)電項目的投資和補貼力度,在數(shù)據(jù)中心推廣應(yīng)用可再生能源,減少數(shù)據(jù)中心對傳統(tǒng)能源的依賴,促進(jìn)可再生能源在數(shù)據(jù)中心的應(yīng)用。例如,某地方政府對采用高效冷卻技術(shù)的數(shù)據(jù)中心給予一次性財政補貼,鼓勵企業(yè)進(jìn)行綠色低碳技術(shù)改造,提高能源利用效率。
推動產(chǎn)業(yè)協(xié)同發(fā)展。通過建立產(chǎn)業(yè)聯(lián)盟或合作平臺,促進(jìn)AI產(chǎn)業(yè)與能源產(chǎn)業(yè)在技術(shù)研發(fā)、標(biāo)準(zhǔn)制定、項目示范等方面的合作,實現(xiàn)協(xié)同發(fā)展合作共贏。例如,能源企業(yè)與AI企業(yè)共同研發(fā)適用于數(shù)據(jù)中心的高效能源存儲和轉(zhuǎn)換技術(shù),雙方還可以共同研制數(shù)據(jù)中心能源管理標(biāo)準(zhǔn)和規(guī)范,提升信息通信領(lǐng)域的能源管理水平,降低能耗。另外,通過產(chǎn)業(yè)協(xié)同合作實現(xiàn)資源共享和優(yōu)勢互補,可降低企業(yè)的能耗和研發(fā)費用。有實踐表明,某能源企業(yè)和AI企業(yè)合作開展數(shù)據(jù)中心儲能項目示范,通過技術(shù)和資源的共享,實現(xiàn)了項目投資成本和運營成本的降低。
3.2 技術(shù)創(chuàng)新提升能源利用效率
創(chuàng)新研發(fā)高效能AI芯片。增加對AI芯片研發(fā)的投入,鼓勵企業(yè)和科研機(jī)構(gòu)開發(fā)具有更高性能功耗比的芯片。比如7 nm、5 nm甚至更小的制程,通過采用先進(jìn)的制程工藝,使得芯片的能耗明顯降低。與此同時,探索存算一體架構(gòu)的新型芯片,將存儲單元和計算單元融合在一起,從而使得數(shù)據(jù)傳輸過程中減少能耗,進(jìn)而提高計算效率。另外,針對不同的AI應(yīng)用場景,設(shè)計專用芯片(Application-Specific Integrated Circuit,ASIC),可以按照特定的任務(wù)進(jìn)行優(yōu)化,實現(xiàn)能源利用效率最大化。以智能安防領(lǐng)域為例,可以設(shè)計專門用于視頻圖像識別的ASIC芯片,相比通用芯片,其在特定任務(wù)上的能效比可提高數(shù)倍。
完善優(yōu)化數(shù)據(jù)中心架構(gòu)與冷卻技術(shù)。采用模塊化數(shù)據(jù)中心架構(gòu),服務(wù)器模塊根據(jù)實際算力需要靈活地配置,從而提高服務(wù)器利用率。同時通過采用冷熱通道分離、熱通道封閉等技術(shù)來優(yōu)化數(shù)據(jù)中心的布局和氣流組織,進(jìn)而降低冷熱空氣的混合,提高冷卻效率降低能耗。另外,開展浸沒式液冷技術(shù)等新型冷卻技術(shù)的研發(fā)和應(yīng)用,將服務(wù)器浸沒在冷卻液中,通過液體的相變帶走熱量,相比傳統(tǒng)的風(fēng)冷技術(shù),將會大幅提升冷卻效率,實現(xiàn)數(shù)據(jù)中心能耗的降低。實踐表明,通過采用浸沒式液冷技術(shù),某數(shù)據(jù)中心冷卻系統(tǒng)的能耗降低了50%以上,能源利用的整體效率得到了明顯提高[9]。
3.3 能源管理優(yōu)化保障供應(yīng)穩(wěn)定性
建立完善的能源管理系統(tǒng)。通過安裝智能電表、傳感器等設(shè)備,基于物聯(lián)網(wǎng)等數(shù)字技術(shù),建立完善的能源管理系統(tǒng),進(jìn)而實現(xiàn)實時監(jiān)測服務(wù)器、冷卻設(shè)備、供電設(shè)備等的能耗情況,以及數(shù)據(jù)中心內(nèi)的溫度、濕度等環(huán)境參數(shù)。同時運用大數(shù)據(jù)分析以及AI技術(shù)對相關(guān)能源或碳排放數(shù)據(jù)進(jìn)行實時分析、預(yù)測,及時發(fā)現(xiàn)不必要的能源浪費和潛在的供電風(fēng)險,進(jìn)而制定科學(xué)合理的能源管理規(guī)劃。有研究顯示,基于能源管理系統(tǒng)的應(yīng)用,通過服務(wù)器負(fù)載動態(tài)調(diào)整供電和冷卻資源分配調(diào)節(jié),可實現(xiàn)精細(xì)化、動態(tài)化的數(shù)據(jù)中心能源管理,在降低運營成本和風(fēng)險的同時還使得能源利用效率提高了20%~30%[14]。
采用多能源混合供應(yīng)方式。數(shù)據(jù)中心可采用多能源混合供應(yīng)方式,將傳統(tǒng)電網(wǎng)供電與可再生能源發(fā)電相結(jié)合,以應(yīng)對可再生能源供應(yīng)的間歇性問題。與此同時,可通過配置電池儲能、超級電容器等儲能系統(tǒng),在需要時儲存可再生能源發(fā)電的多余能量,以增加能源供應(yīng)的穩(wěn)定性及可靠性,以達(dá)到蓄能發(fā)電的目的[15]。通過智能能量管理系統(tǒng)實現(xiàn)能源的自我管理和優(yōu)化調(diào)度,并根據(jù)數(shù)據(jù)中心的負(fù)荷需求和外部電網(wǎng)情況,靈活調(diào)整能源供應(yīng)模式,實現(xiàn)與大電網(wǎng)的互動和協(xié)同運行。例如,為減少對傳統(tǒng)電網(wǎng)的依賴,同時降低能源成本,某數(shù)據(jù)中心采用多能源混合供應(yīng)模式后,其可再生能源利用率提高了30%以上。
4 結(jié)束語
AI時代,智能算力的快速發(fā)展給能源領(lǐng)域帶來了嚴(yán)峻的挑戰(zhàn)。然而通過技術(shù)創(chuàng)新研發(fā)、能源管理優(yōu)化以及政策支持與產(chǎn)業(yè)協(xié)同等方面多措并舉,可以有效提升能源利用效率、保障能源供應(yīng)穩(wěn)定性以及降低能源成本,不僅有助于推動AI產(chǎn)業(yè)的綠色低碳可持續(xù)發(fā)展,而且對能源結(jié)構(gòu)優(yōu)化、環(huán)境保護(hù)等方面都有很好的促進(jìn)作用。未來發(fā)展中,各政府、行業(yè)、企業(yè)需緊密合作,為構(gòu)建AI時代的美好未來奠定堅實基礎(chǔ),共同探索更加高效、綠色的智能算力能源解決方案。