中國(guó)儲(chǔ)能網(wǎng)訊:隨著人工智能大模型的迅猛發(fā)展,GPU算力集群的能源消耗正成為行業(yè)關(guān)注的熱點(diǎn)。本文對(duì)2030年之前的全球及我國(guó)GPU算力集群的電力需求增長(zhǎng)趨勢(shì)做了測(cè)算,分析了其潛在影響,并探討了部分應(yīng)對(duì)策略。
本文認(rèn)為,GPU算力集群目前占全球整體電力消耗約為千分之一,短期內(nèi)不會(huì)造成全球性電力供應(yīng)短缺,但是由于新建GPU算力集群主要集中在美國(guó),會(huì)對(duì)其局部電力供給和傳輸帶來(lái)相對(duì)嚴(yán)峻的挑戰(zhàn)。與此同時(shí),中國(guó)的GPU算力增長(zhǎng)短期內(nèi)不會(huì)導(dǎo)致電力短缺。不過(guò),預(yù)計(jì)2030年,GPU算力集群可能占全國(guó)電力消耗的2.7%,接近重點(diǎn)用能行業(yè)的規(guī)模,因此需要統(tǒng)籌規(guī)劃和管理其用電政策,需要重點(diǎn)關(guān)注區(qū)域性電力缺口和跨區(qū)域新能源消納的問(wèn)題。本文提出,可以從提升AI算力的計(jì)算效率、推動(dòng)GPU算力的合理布局和優(yōu)化綠電交易政策、加強(qiáng)新型電力系統(tǒng)建設(shè)三方面著手,來(lái)應(yīng)對(duì)AI大模型帶來(lái)的能源挑戰(zhàn)。
GPU算力的快速增長(zhǎng)引發(fā)人們對(duì)電力短缺的擔(dān)憂。AI大模型對(duì)算力的需求激增,使得行業(yè)面對(duì)“算不出”和“算不起”的雙重挑戰(zhàn):一方面,傳統(tǒng)CPU架構(gòu)難以勝任大模型的訓(xùn)練和推理任務(wù),以GPU(圖形處理單元)為核心的算力集群建設(shè)正在快速增長(zhǎng);另一方面,大模型規(guī)模快速增大對(duì)訓(xùn)練資源的更高要求,以及出于降低單位推理成本的考慮,單體GPU算力集群的規(guī)模也在快速提升。電力供給正在成為新建GPU算力集群的制約因素之一。根據(jù)國(guó)際能源署IEA《電力2024》的報(bào)告,一次谷歌搜索需要0.3瓦時(shí)的電力,而一次ChatGPT請(qǐng)求則需要2.9瓦時(shí)的電力,如果利用ChatGPT處理每天90億次的搜索,預(yù)計(jì)每年電力消耗將增加10太瓦時(shí)(1TWh=10億度電)。
在此背景下,阿里研究院與阿里云采購(gòu)部碳管理與能源采購(gòu)團(tuán)隊(duì)進(jìn)行了初步測(cè)算和分析,本文評(píng)估了全球和國(guó)內(nèi)GPU算力集群的電力需求和比重,并探討了應(yīng)對(duì)AI大模型電力挑戰(zhàn)的部分應(yīng)對(duì)策略。需要說(shuō)明的是,本文的測(cè)算對(duì)象特指服務(wù)于AI大模型訓(xùn)練和推理的GPU算力集群,不包含以CPU為主的傳統(tǒng)數(shù)據(jù)中心。
一、AI大模型的用電需求大幅增長(zhǎng),能源問(wèn)題引發(fā)行業(yè)關(guān)注
GPU算力需求的激增給電網(wǎng)和供電帶來(lái)了新的壓力。隨著AI大模型的興起,GPU算力集群正日益成為新建IDC的主流。然而,GPU服務(wù)器的功率通常是CPU服務(wù)器的數(shù)倍,這意味著GPU服務(wù)器的高功率將顯著增加數(shù)據(jù)中心的散熱系統(tǒng)能耗和總體能耗。在大模型訓(xùn)練階段,需要將超過(guò)萬(wàn)卡以上的GPU部署在同一地點(diǎn),以實(shí)現(xiàn)芯片間和服務(wù)器之間的高速網(wǎng)絡(luò)連接,這導(dǎo)致超大規(guī)模的GPU算力集群在擴(kuò)建時(shí)受到電力供應(yīng)的限制。3月底,一條社交媒體的消息在國(guó)內(nèi)AI圈快速傳播,凸顯了GPU算力集群建設(shè)受限于電力供給并會(huì)對(duì)電網(wǎng)穩(wěn)定性帶來(lái)的影響。根據(jù)微軟工程師的爆料,為了訓(xùn)練GPT-6,微軟在試圖搭建擁有10萬(wàn)塊英偉達(dá)H100 GPU的訓(xùn)練集群,但是如果在同一個(gè)州部署這樣規(guī)模的集群,可能會(huì)導(dǎo)致電網(wǎng)崩潰,因此不得不跨區(qū)域部署。
隨著AI大模型從訓(xùn)練階段步入推理階段,其推理算力需求會(huì)顯著高于訓(xùn)練算力。AI大模型的電力需求將進(jìn)一步增加,對(duì)不同區(qū)域的總體電力供應(yīng)將帶來(lái)挑戰(zhàn)。荷蘭國(guó)家銀行的數(shù)據(jù)專家Alex de Vries估計(jì),類似ChatGPT這樣的AI系統(tǒng),每天處理約2億個(gè)用戶請(qǐng)求所消耗的電力,相當(dāng)于1.7萬(wàn)個(gè)美國(guó)家庭的日常用電量。據(jù)第三方推測(cè),文生視頻應(yīng)用Sora的訓(xùn)練算力需求大概是GPT-4的1/4左右,而其推理算力需求是GPT-4的1000倍以上,更多的算力需求將帶來(lái)更嚴(yán)峻的電力挑戰(zhàn)。上述現(xiàn)象凸顯了在AI技術(shù)快速發(fā)展的同時(shí),亟需關(guān)注和優(yōu)化數(shù)據(jù)中心的能源問(wèn)題。
美國(guó)人工智能企業(yè)家不斷表達(dá)對(duì)“缺電”的焦慮,引發(fā)國(guó)內(nèi)的關(guān)注升溫。特斯拉CEO馬斯克在博世互聯(lián)世界2024大會(huì)上預(yù)言,“接下來(lái)陷入短缺的將是電力,到明年(2025年),我們就沒(méi)有足夠的電力來(lái)運(yùn)行所有的芯片了” 。據(jù)報(bào)道,英偉達(dá)創(chuàng)始人黃仁勛在斯坦福大學(xué)演講中表示:“AI的盡頭是光伏和儲(chǔ)能!我們不能只想著算力,如果只考慮計(jì)算機(jī),我們需要燒掉14個(gè)地球的能源。超級(jí)AI將成為電力需求的無(wú)底洞” 。在瑞士達(dá)沃斯舉行的世界經(jīng)濟(jì)論壇年會(huì)上,OpenAI的創(chuàng)始人奧特曼警告說(shuō),下一波生成型人工智能系統(tǒng)消耗的電力將遠(yuǎn)遠(yuǎn)超出預(yù)期,能源系統(tǒng)將難以應(yīng)對(duì),未來(lái)AI的技術(shù)取決于能源,我們需要更多的光伏和儲(chǔ)能。
不同研究報(bào)告對(duì)AI能源消耗的預(yù)測(cè)結(jié)果也各不相同,進(jìn)一步加劇行業(yè)對(duì)GPU算力集群能耗的疑問(wèn)。國(guó)際能源署IEA最近的《電力2024》報(bào)告中預(yù)計(jì)到2026年,AI數(shù)據(jù)中心的電力需求將達(dá)到90TWh(1TWh=10億度電)。SemiAnalysis預(yù)測(cè),2024年初Al數(shù)據(jù)中心的功率將超過(guò)10GW,2026年底將達(dá)到40GW。Alex de Vries預(yù)測(cè)到2027年,全球新制造的服務(wù)器與人工智能相關(guān)的能耗可能會(huì)增加到85TWh至134TWh的電力。
我國(guó)GPU算力集群建設(shè)加速,能源優(yōu)化成為關(guān)鍵問(wèn)題。國(guó)內(nèi)AI產(chǎn)業(yè)界的蓬勃發(fā)展推動(dòng)AI算力的需求快速增長(zhǎng),各大領(lǐng)先公司正在投入巨資打造超過(guò)萬(wàn)卡級(jí)別的AI算力集群。2024年2月,國(guó)務(wù)院國(guó)資委舉辦了人工智能專題推進(jìn)會(huì)議,明確提出了加快智能算力中心建設(shè)的戰(zhàn)略目標(biāo)。幾乎同時(shí),北京和上海等一線城市已投入巨額資金,打造先進(jìn)的人工智能公共算力平臺(tái),以支持本地及周邊地區(qū)的AI產(chǎn)業(yè)研究和商業(yè)應(yīng)用。其他城市也在積極規(guī)劃和籌建各自的AI算力平臺(tái),以期在未來(lái)的AI技術(shù)競(jìng)爭(zhēng)中占據(jù)有利位置。如何提升新建GPU算力能效并滿足其電力需求,特別是在國(guó)家雙碳戰(zhàn)略的背景下優(yōu)化GPU算力集群的能源結(jié)構(gòu),更多消納綠色能源,成為一項(xiàng)復(fù)雜而緊迫的任務(wù)。
二、GPU算力集群不會(huì)造成全球電力供應(yīng)短缺,但是美國(guó)局部電力供給和傳輸挑戰(zhàn)相對(duì)嚴(yán)峻
我們的測(cè)算方法結(jié)合了GPU算力集群的能耗數(shù)據(jù)、不同型號(hào)GPU芯片的出貨量、知名研究機(jī)構(gòu)對(duì)市場(chǎng)增速的預(yù)測(cè),以及來(lái)自國(guó)際能源署、國(guó)家能源局等機(jī)構(gòu)對(duì)用電總量的預(yù)測(cè),來(lái)推算GPU算力集群逐年的用能需求和比重。
短期測(cè)算顯示,截至2023年底,GPU算力集群占全球整體電力消耗約為千分之一,在接下來(lái)的1-2年內(nèi),GPU算力集群不會(huì)造成整體的電力供應(yīng)短缺。
截至2023年底,全球GPU算力集群全年的電力消耗約為 29 TWh(1TWh=10億度電),占全球電力消耗的0.1%。
預(yù)計(jì)至2024年底,全球GPU算力集群全年的電力消耗約為 85 TWh,占全球電力消耗的0.3%,占比約為2023年的3倍。
長(zhǎng)期測(cè)算來(lái)看,至2030年,全球GPU算力集群的電力需求會(huì)有幾十倍的增長(zhǎng),以較快增長(zhǎng)的假設(shè)計(jì)算,GPU算力集群耗電占全球比例將達(dá)到3.2%,成為一個(gè)重點(diǎn)關(guān)注的新興用能行業(yè)。
預(yù)計(jì)至2026年底,全球GPU算力集群全年的電力消耗約為 316 TWh,GPU算力集群全年的電力消耗占全球電力消耗的1.1%。
預(yù)計(jì)至2030年底,全球GPU算力集群全年的電力消耗約為1058 TWh,GPU算力集群全年的電力消耗占全球電力消耗的3.2%。
根據(jù)上述測(cè)算,2024年至2030年,全球GPU算力集群年度總耗電量將增長(zhǎng)約11倍,年復(fù)合增長(zhǎng)率為52.2 %。
新建GPU算力集群主要集中在美國(guó),會(huì)對(duì)局部電力供給和傳輸帶來(lái)顯著挑戰(zhàn)。
從需求側(cè)來(lái)看,新建GPU算力集群主要集中在美國(guó)本土。據(jù)第三方數(shù)據(jù)測(cè)算,英偉達(dá)獨(dú)占全球90%的AI芯片市場(chǎng)。受美國(guó)商務(wù)部對(duì)中國(guó)高端芯片禁運(yùn)政策的影響,美國(guó)公司已經(jīng)成為英偉達(dá)芯片的最主要客戶,再加上美國(guó)算力中心的平均電價(jià)在主要經(jīng)濟(jì)體中很低(平均約為0.083美元/度),新建的GPU算力集群在美國(guó)本土進(jìn)一步集中,因此美國(guó)的GPU算力集群的單體規(guī)模和總體電力消耗的增長(zhǎng)速度都遙遙領(lǐng)先于全球水平。據(jù)SemiAnalysis預(yù)測(cè),人工智能熱潮將會(huì)推動(dòng)美國(guó)全部數(shù)據(jù)中心電力(GPU算力集群只是其中一部分)需求從2023年的23 GW 增長(zhǎng)到2026年的52 GW, 占美國(guó)總發(fā)電量的比例從2023年的4.5%增加至2026年的10%。
從供給側(cè)來(lái)看,美國(guó)的電力系統(tǒng)相對(duì)脆弱。美國(guó)電力基礎(chǔ)設(shè)施更陳舊,大面積停電的情況時(shí)有發(fā)生,且輸電能力增長(zhǎng)緩慢。以單體部署10萬(wàn)塊英偉達(dá)H100 的GPU算力集群為例,其功耗超過(guò)13萬(wàn)千瓦(1GW=100萬(wàn)千瓦),約等于10萬(wàn)個(gè)美國(guó)家庭的用電量,將為區(qū)域電網(wǎng)的穩(wěn)定性帶來(lái)巨大的挑戰(zhàn)。據(jù)外媒報(bào)道,美國(guó)能源部,微軟和亞馬遜正在考慮建設(shè)核聚變和核裂變發(fā)電廠來(lái)滿足GPU算力集群快速擴(kuò)張的需要,亞馬遜以6.5億美元買(mǎi)下了緊鄰核電站的一處數(shù)據(jù)中心園區(qū)。
因此對(duì)美國(guó)而言,一方面是急劇增長(zhǎng)的AI大模型用電需求,一方面是陳舊且脆弱的電力網(wǎng)絡(luò),美國(guó)AI產(chǎn)業(yè)界的眾多大佬對(duì)電力供應(yīng)的擔(dān)憂是可以理解的。與之相比,我國(guó)的電網(wǎng)不僅采用了超高壓輸電等先進(jìn)技術(shù),而且相較于化工、金屬冶煉和礦物制品等高能耗產(chǎn)業(yè),為超過(guò)10萬(wàn)千瓦的GPU算力集群供電并不是一個(gè)重大挑戰(zhàn),因此對(duì)電網(wǎng)整體造成的壓力并不像美國(guó)那樣顯著。
三、我國(guó)GPU算力集群用電需求將增長(zhǎng)迅速,短期內(nèi)不會(huì)導(dǎo)致電力短缺,但需提前統(tǒng)籌規(guī)劃用電政策保障可持續(xù)發(fā)展
短期測(cè)算顯示,我國(guó)GPU算力集群的電力消耗占比相對(duì)較小,短期內(nèi)不會(huì)引發(fā)電力短缺。未來(lái)2-3年內(nèi),我國(guó)GPU算力集群的電力需求進(jìn)入快速增長(zhǎng)期,預(yù)計(jì)2024年GPU算力集群的電力消耗將是2023年的3倍。由于目前GPU算力集群占全國(guó)電力總消耗的比重僅為千分之一,因此短期內(nèi)并不會(huì)對(duì)我國(guó)電力供應(yīng)總量帶來(lái)沖擊,不會(huì)引起整體性電力短缺。
截至2023年底,我們測(cè)算國(guó)內(nèi)GPU算力集群全年電力消耗約為8.7 TWh(1TWh=10億度電),占全國(guó)電力消耗的0.1%。
預(yù)計(jì)至2024年底,我國(guó)GPU算力集群全年電力消耗將增長(zhǎng)至27.1 TWh度電,占全國(guó)電力消耗的0.28%。
長(zhǎng)期測(cè)算來(lái)看,GPU算力集群接近重點(diǎn)用能行業(yè)的規(guī)模,需要提前進(jìn)行用電政策的統(tǒng)籌規(guī)劃和管理。預(yù)計(jì)至2030年,GPU算力集群的電力消耗將會(huì)逼近重點(diǎn)用能行業(yè)的規(guī)模。GPU算力集群的電力消耗距離高載能行業(yè)還有差距。據(jù)國(guó)家能源局?jǐn)?shù)據(jù), 2023年全年,占全社會(huì)用電量比例高于4%的行業(yè)依次有化工、黑色金屬冶煉、有色金屬冶煉、非金屬礦物制品、電力熱力等行業(yè),其中前四大高載能行業(yè)占比約為26.3%。按照上述預(yù)計(jì),2030年GPU算力集群的電力消耗雖低于2023年四大高載能行業(yè)占比,但也已經(jīng)到了需要引起重視的規(guī)模,需要提前進(jìn)行用電政策的統(tǒng)籌規(guī)劃和管理。
以偏較快增速的假設(shè)測(cè)算,預(yù)計(jì)至2026年底,我國(guó)GPU算力集群全年的電力消耗約為96.2 TWh,GPU算力集群全年的電力消耗占全國(guó)電力消耗的0.99%。
預(yù)計(jì)至2030年底,我國(guó)GPU算力集群全年的電力消耗約為306.3 TWh,GPU算力集群全年的電力消耗占全國(guó)電力消耗的2.71 %。
根據(jù)上述測(cè)算,2024年至2030年,我國(guó)GPU算力集群年度總耗電量將增長(zhǎng)約10倍,年復(fù)合增長(zhǎng)率為49.8%。
從總體供需關(guān)系看,新增的GPU算力集群功耗遠(yuǎn)低于我國(guó)新能源裝機(jī)容量的增長(zhǎng)。比對(duì)用電端和發(fā)電端的總體數(shù)據(jù)來(lái)看,持續(xù)擴(kuò)大的新能源發(fā)電規(guī)模,結(jié)合正在推進(jìn)中的新型電力系統(tǒng)建設(shè),總體上能夠滿足高速增長(zhǎng)的GPU算力集群用電需要。據(jù)國(guó)家能源局?jǐn)?shù)據(jù),2023年,全國(guó)發(fā)電裝機(jī)容量約為2900GW,其中除火電外的清潔能源裝機(jī)容量約為1500GW,占比為52.3%。其中風(fēng)電和光伏近年來(lái)增長(zhǎng)速度持續(xù)維持高位,2023年分別同比增長(zhǎng)20.7%和55.2%。按照前述預(yù)測(cè),2030年全國(guó)GPU算力集群功耗約為35GW,新能源新增裝機(jī)規(guī)模將遠(yuǎn)超過(guò)GPU算力集群的功耗需求。
當(dāng)前面臨的突出問(wèn)題是如何解決GPU算力集群的區(qū)域性電力缺口,以及如何提高跨區(qū)域的新能源消納能力。雖然總體供需上不會(huì)引起電力短缺,但是考慮到GPU算力集群具有單地點(diǎn)、全時(shí)段、大功率的用電特點(diǎn),亟需建設(shè)的超大型GPU算力集群的選址可能因?yàn)閰^(qū)域性的能耗指標(biāo)分配、電網(wǎng)網(wǎng)架結(jié)構(gòu)、雙碳政策等因素受到限制,因此需要為GPU算力集群的能耗指標(biāo)、能源結(jié)構(gòu)和用電政策等做統(tǒng)籌規(guī)劃。此外,對(duì)于GPU算力集群密集分布的部分區(qū)域,用電需求的快速增長(zhǎng)有可能會(huì)對(duì)局部電力供給和輸配電設(shè)施建設(shè)造成短期壓力,如何提升跨區(qū)域的風(fēng)光電等新能源消納比例是亟待解決的問(wèn)題。
四、應(yīng)對(duì)AI大模型電力挑戰(zhàn)的思考
應(yīng)對(duì)AI大模型帶來(lái)的能源挑戰(zhàn),可以從提升AI算力的能效、產(chǎn)業(yè)政策、智能電網(wǎng)和優(yōu)化GPU算力集群能耗和能源結(jié)構(gòu)等方面綜合考慮。本文主要圍繞前三個(gè)方面探討應(yīng)對(duì)策略。
應(yīng)對(duì)策略一:整體優(yōu)化計(jì)算架構(gòu)和計(jì)算服務(wù)的提供方式,提升AI算力的計(jì)算效率。
提升AI算力的計(jì)算效率是應(yīng)對(duì)未來(lái)電力需求增長(zhǎng)的關(guān)鍵策略,可以從AI芯片、服務(wù)器和服務(wù)提供方式三個(gè)層面,來(lái)引導(dǎo)和激勵(lì)相關(guān)產(chǎn)業(yè)研發(fā)和應(yīng)用計(jì)算效率更優(yōu)的技術(shù)和產(chǎn)品。
提升AI芯片的計(jì)算效率。目前行業(yè)通行的做法包括制程技術(shù)提升、架構(gòu)創(chuàng)新、低功耗設(shè)計(jì)、軟硬件協(xié)同等,涵蓋了從工藝、架構(gòu)、電路設(shè)計(jì)、系統(tǒng)層級(jí)優(yōu)化等多個(gè)方面,此領(lǐng)域的創(chuàng)新正在不斷演進(jìn)。英偉達(dá)最新發(fā)布的GB200 GPU與上一代的H100 GPU相比,每瓦數(shù)的TFLOPS(每秒浮點(diǎn)運(yùn)算次數(shù))提高了47%。此外,業(yè)界正在探索設(shè)計(jì)大模型專用芯片等方式提升計(jì)算效率,例如美國(guó)初創(chuàng)科技企業(yè)Groq開(kāi)發(fā)了專門(mén)面向大模型推理場(chǎng)景優(yōu)化設(shè)計(jì)的LPU芯片。
降低服務(wù)器能耗??伸`活配置、高密度、高兼容性的服務(wù)器架構(gòu)設(shè)計(jì)也能夠有效降低服務(wù)器能耗。例如基于方升架構(gòu)的阿里云磐久服務(wù)器G系列,與傳統(tǒng)架構(gòu)相比,系統(tǒng)散熱能力提升10%,散熱能耗降低30%以上。越來(lái)越高的芯片和服務(wù)器密度也促使業(yè)界開(kāi)始采用直接芯片(Direct-to-Chip)冷卻等液冷技術(shù),如英偉達(dá)最新發(fā)布的GB200 NVL72機(jī)柜可容納72 個(gè)Blackwell GPU,并采用一體水冷散熱方案,從而大幅降低能耗。
提高資源利用效率。依托公共云來(lái)提供AI算力服務(wù)能夠有效提升資源利用率,降低運(yùn)營(yíng)成本特別是用電成本。公共云通過(guò)資源分配和任務(wù)調(diào)度技術(shù),可以提升GPU的負(fù)載利用率,從而降低單位算力的能耗成本,是提高GPU計(jì)算效率的最高效、最便捷的方式之一。
應(yīng)對(duì)策略二:優(yōu)先支持在八大樞紐數(shù)據(jù)中心集群建設(shè)GPU算力集群,探索跨區(qū)跨省的綠電和綠證交易,集中滿足綠電需求。
根據(jù)發(fā)改數(shù)據(jù)〔2023〕1779號(hào)文的要求,到2025年,在八大數(shù)據(jù)中心國(guó)家樞紐節(jié)點(diǎn)中,新建數(shù)據(jù)中心的綠電使用比例需超過(guò)80%。建議考慮在新能源資源豐富的國(guó)家級(jí)算力樞紐節(jié)點(diǎn)出臺(tái)鼓勵(lì)措施,優(yōu)先布局GPU算力集群,對(duì)于推動(dòng)GPU算力的合理布局、優(yōu)化供需和綠電集約發(fā)展等都具有重大意義。由于八大樞紐的新能源資源分布不均衡,對(duì)于樞紐集群內(nèi)GPU算力在優(yōu)先消納本地新能源后的不足部分,建議探索通過(guò)跨區(qū)跨省的綠電、綠證交易來(lái)滿足需求。
應(yīng)對(duì)策略三:加強(qiáng)新型電力系統(tǒng)建設(shè),增強(qiáng)電網(wǎng)敏捷調(diào)度能力。
大量新能源的接入對(duì)于電力系統(tǒng)穩(wěn)定性的挑戰(zhàn)已是確定性問(wèn)題,而GPU算力作為一個(gè)快速增長(zhǎng)且穩(wěn)定的用電負(fù)荷,需要持續(xù)運(yùn)行且不易調(diào)節(jié),很難參與傳統(tǒng)用電的需求響應(yīng)。因此,加強(qiáng)新型電力系統(tǒng)建設(shè)顯得尤為重要,通過(guò)智能化技術(shù)提升新能源發(fā)電量與工商業(yè)用電的源荷匹配度,增強(qiáng)電網(wǎng)的敏捷調(diào)度能力,既能保障對(duì)GPU算力集群的穩(wěn)定供電,又能盡量增加新能源電量的本地消納。
結(jié)語(yǔ)
隨著AI大模型時(shí)代的到來(lái),GPU算力需求激增,不僅推動(dòng)了云計(jì)算和能源管理技術(shù)的革新,也引發(fā)了對(duì)電力供應(yīng)穩(wěn)定性的廣泛關(guān)注。盡管短期內(nèi)GPU算力集群的電力消耗在全球范圍內(nèi)占比仍小,但預(yù)計(jì)至2030年其能耗將顯著增長(zhǎng),成為重點(diǎn)關(guān)注的用能領(lǐng)域,尤其是美國(guó)面臨局部電力供給和傳輸帶來(lái)嚴(yán)峻挑戰(zhàn)。
隨著中國(guó)GPU算力集群建設(shè)的加速,短期內(nèi)電力需求雖快速增長(zhǎng)但整體可控;長(zhǎng)期來(lái)看,則需要前瞻性的規(guī)劃來(lái)應(yīng)對(duì)局部用電缺口和綠電消納的挑戰(zhàn)。利用技術(shù)手段提升AI算力能效是應(yīng)對(duì)電力挑戰(zhàn)的關(guān)鍵策略,此外,合理布局GPU算力集群與綠電供應(yīng),加強(qiáng)新型電力系統(tǒng)建設(shè),提升電網(wǎng)調(diào)度能力,對(duì)于確保AI技術(shù)的可持續(xù)發(fā)展至關(guān)重要。
總之,GPU算力集群的快速發(fā)展對(duì)全球能源體系提出新要求,需要技術(shù)創(chuàng)新、政策引導(dǎo)與行業(yè)協(xié)作,以實(shí)現(xiàn)AI算力的高效、綠色、可持續(xù)增長(zhǎng)。希望通過(guò)本文拋磚引玉,促進(jìn)更多業(yè)內(nèi)專家投入對(duì)這一議題的深入討論和持續(xù)研究,為行業(yè)內(nèi)外的決策者提供數(shù)據(jù)支持,共同探討如何解決可能的電力挑戰(zhàn)。