中國儲能網(wǎng)訊:今年初,杭州深度求索公司先后上線DeepSeek V3基座模型和專為復(fù)雜推理任務(wù)設(shè)計的DeepSeek R1模型,并同步開源開放,以卓越的性能超越或媲美全球頂級的開源及閉源模型,在美國和中國區(qū)域應(yīng)用商店下載量持續(xù)排名第一,引發(fā)了全球人工智能領(lǐng)域的廣泛關(guān)注與強烈反響。筆者認為,需要提前研判DeepSeek廣泛應(yīng)用對新型電力系統(tǒng)建設(shè)與發(fā)展產(chǎn)生的影響,并采取相應(yīng)的措施確保能源安全,助力實現(xiàn)人工智能技術(shù)進步,從而把握新一代人工智能帶來的各種機遇。
DeepSeek在各行業(yè)的應(yīng)用現(xiàn)狀
DeepSeek采用混合專家模型、多頭注意力機制和知識蒸餾技術(shù),大幅降低了大模型的訓(xùn)練和推理的算力需求,提升了模型效率,在數(shù)學(xué)、代碼和推理任務(wù)方面的性能能夠與OpenAI-o1相媲美,已在全球140多個國家和地區(qū)的應(yīng)用排行榜上登頂,并在各行業(yè)得到了廣泛應(yīng)用。
DeepSeek能引發(fā)行業(yè)震動的核心原因是在效率和成本控制上的突破。DeepSeek通過模型結(jié)構(gòu)完善、訓(xùn)練方式優(yōu)化、底層算力調(diào)度等方面的系統(tǒng)級創(chuàng)新,在相對較低的算力投入下,獲得可媲美甚至超越頭部模型的性能表現(xiàn),實現(xiàn)了“低成本、高性能、準推理”,打破以“大算力、大數(shù)據(jù)”為核心的生成式人工智能擴展定律,將訓(xùn)練成本和能耗控制在頂尖大模型的1/20,訓(xùn)練成本僅為560萬美元,為探索通用人工智能開辟了新道路。DeepSeek的開源與低成本也促成了ChatGPT和“文心一言”等大模型的免費應(yīng)用,有望改變閉源壟斷的市場格局,倒逼行業(yè)巨頭轉(zhuǎn)向開源生態(tài),有助于我國突破技術(shù)封鎖,開辟出一條“以開放破封鎖、以協(xié)作促創(chuàng)新”的中國AI發(fā)展路徑。
DeepSeek正以前所未有的速度應(yīng)用到各行各業(yè)。在政務(wù)領(lǐng)域,深圳、廣州、臨沂等多地政府已完成DeepSeek模型本地化部署。在互聯(lián)網(wǎng)行業(yè),國家超算互聯(lián)網(wǎng)平臺上線了從1.5b到70b的各級蒸餾模型;阿里云、百度云、華為云、騰訊云、天翼云等主流云平臺陸續(xù)官宣接入DeepSeek模型,提供多樣化的部署選項和服務(wù);硅基流動等AI基礎(chǔ)設(shè)施廠商宣布適配并上架DeepSeek模型服務(wù)。在電信行業(yè),3家運營商均全面接入DeepSeek開源大模型。在金融行業(yè),已有16家券商、10余家公募基金公司以及多家銀行和保險機構(gòu)完成接入或部署。在能源電力領(lǐng)域,“三桶油”、國家電網(wǎng)公司、南方電網(wǎng)公司及五大發(fā)電集團均已完成DeepSeek私有化部署,并將其接入自身的數(shù)字平臺。
國外對Deepseek的數(shù)據(jù)安全與隱私保護仍持有謹慎態(tài)度。DeepSeek尚未建立透明的數(shù)據(jù)托管機制,其在線應(yīng)用會將用戶數(shù)據(jù)存儲在我國境內(nèi),因此遭到了部分歐美國家的抵制。美國國會議員以數(shù)據(jù)安全為由,提出一項兩黨法案禁止在聯(lián)邦政府的設(shè)備上使用DeepSeek。意大利數(shù)據(jù)保護局以缺乏DeepSeek應(yīng)用個人數(shù)據(jù)的具體方式為由,限制DeepSeek處理意大利用戶的數(shù)據(jù)。澳大利亞也以強制性指令禁止政府設(shè)備訪問DeepSeek,以杜絕數(shù)據(jù)泄露的隱患。
對新型電力系統(tǒng)建設(shè)的影響
DeepSeek通過用戶使用和行業(yè)應(yīng)用這兩條路徑對新型電力系統(tǒng)建設(shè)產(chǎn)生影響。一方面,電力用戶的廣泛應(yīng)用將通過模型訓(xùn)練推理的電力需求影響電力系統(tǒng)穩(wěn)定;另一方面,電力企業(yè)對DeepSeek的應(yīng)用,也將引發(fā)系統(tǒng)運行和企業(yè)經(jīng)營的系列變革,從而推動新型電力系統(tǒng)建設(shè)。遵循以上兩個方向,筆者的研究團隊從算力及電力需求、電網(wǎng)規(guī)劃、應(yīng)用效果和安全自主可控四個方面,深入分析DeepSeek對新型電力系統(tǒng)建設(shè)的影響。
一是DeepSeek的技術(shù)進步或?qū)⒃黾诱w的算力及電力需求,為“綠電+算力中心”提供了發(fā)展空間。雖然DeepSeek通過優(yōu)化算法、硬件適配等技術(shù),顯著提升了人工智能算力效率,降低了單次任務(wù)的能耗,打破了人工智能應(yīng)用的經(jīng)濟門檻,但DeepSeek的技術(shù)進步也將同步觸發(fā)“杰文斯悖論”,能源消耗總量或?qū)⑼黄凭€性增長模式,形成“效率提升-應(yīng)用擴張-能耗躍升”的閉環(huán)。一方面,DeepSeek的開源和低算力的特性,降低了大模型行業(yè)的準入門檻,也將激發(fā)公眾的大模型應(yīng)用需求,從而引發(fā)整體算力增長。DeepSeek弱化了國外對先進算力的限制,將促進更多的供應(yīng)商提供更為廣泛的服務(wù),同時也將激發(fā)用戶在本地部署大模型的需求。另一方面,DeepSeek依賴于高精度模型知識蒸餾技術(shù),需要有個復(fù)雜且性能優(yōu)異的“教師模型”將知識遷移到“學(xué)生模型”中。因此,需要大的算力來支撐高參數(shù)、高準確性的“教師模型”訓(xùn)練。基于上述兩個因素,DeepSeek及其技術(shù)廣泛應(yīng)用之后,仍將引發(fā)算力和電力需求的快速上升,也需要綠色電力來保障算力中心的巨量電力需求。
二是DeepSeek的廣泛應(yīng)用將改變算力中心的負載分布,對配電網(wǎng)規(guī)劃和運行產(chǎn)生一定沖擊。DeepSeek打破了原有數(shù)據(jù)中心市場格局的平衡,為市場帶來了新的競爭力量。以往,大型數(shù)據(jù)中心憑借其雄厚的資金實力和先進的技術(shù)設(shè)施,在AI計算服務(wù)領(lǐng)域占據(jù)主導(dǎo)地位,為大型科技公司提供定制化的算力支持。然而,DeepSeek可無視邊緣側(cè)數(shù)據(jù)中心算力低的劣勢,并激發(fā)時延低和貼近應(yīng)用的優(yōu)勢,推動邊緣側(cè)數(shù)據(jù)中心承接延遲敏感的應(yīng)用需求,使得一些中小型數(shù)據(jù)中心也有機會參與到AI計算服務(wù)的競爭中來,同時也迫使亞馬遜、阿里云等云計算巨頭調(diào)整部分大型數(shù)據(jù)中心的建設(shè)投入,轉(zhuǎn)而加強邊緣計算和分布式算力布局。邊緣側(cè)部署DeepSeek需要對應(yīng)的電力來驅(qū)動服務(wù)器、存儲設(shè)備和網(wǎng)絡(luò)設(shè)備,導(dǎo)致整體能耗上升,易引發(fā)高峰期的電力供應(yīng)緊張,因此,需要提升配網(wǎng)承載能力,同時也要依靠大模型來提高電力分配和管理效率,以弱化因大模型而引發(fā)的電力供應(yīng)緊張。
三是DeepSeek與電力業(yè)務(wù)深度融合將為電力行業(yè)帶來深刻變革,進一步優(yōu)化業(yè)務(wù)流程。相比其他的大模型,DeepSeek通過技術(shù)進步有效提升了大模型的普惠性,推動了大模型在工程場景中的規(guī)模化應(yīng)用,具有在電力行業(yè)海量運行場景中深化應(yīng)用的潛力,并能提升專業(yè)模型的應(yīng)用效率,加強個性問題推理的邏輯性,實現(xiàn)在考慮全局情況下的最優(yōu)回答,不僅能作為一個智慧辦公助手,更有望成為一個綜合型的電力行業(yè)專家,可輔助業(yè)務(wù)人員完成對當前問題的分析,給出解決方案。例如,在設(shè)備管理上,專業(yè)模型需要根據(jù)區(qū)域差異優(yōu)化相應(yīng)參數(shù),DeepSeek可以考慮區(qū)域地理、氣候等因素,輔助調(diào)試專業(yè)模型;在電網(wǎng)調(diào)度上,可以根據(jù)區(qū)域網(wǎng)架結(jié)構(gòu)和能源結(jié)構(gòu)特性完成調(diào)度指令輔助。
四是DeepSeek可更改底層代碼,實現(xiàn)差異化需求,確保電力大模型技術(shù)的自主可控和保障信息安全。電力行業(yè)作為國家的基礎(chǔ)性產(chǎn)業(yè),對核心技術(shù)國產(chǎn)化有著較高要求,實現(xiàn)國產(chǎn)化替代的需求十分迫切。DeepSeek作為國產(chǎn)的模型系統(tǒng),可以避免國內(nèi)電力系統(tǒng)與國外模型適配性低的問題,而且不同于閉源模型的技術(shù)壁壘,應(yīng)用企業(yè)可以深入了解模型的架構(gòu)和算法,并根據(jù)自身業(yè)務(wù)需求進行深度改進和優(yōu)化定制。同時,DeepSeek在設(shè)計和開發(fā)過程中充分考慮了信息安全因素,因其源自國產(chǎn)模型系統(tǒng),研發(fā)和維護團隊熟悉國內(nèi)應(yīng)用環(huán)境,能夠更好地遵循國家信息安全政策和標準,減少了因外部因素導(dǎo)致的信息泄漏風(fēng)險,可以確保電力數(shù)據(jù)在采集、傳輸和分析過程中的安全性。
與新型電力系統(tǒng)建設(shè)深度融合的著力點
DeepSeek在訓(xùn)練效率、安全可控和精準度上展現(xiàn)了較強的優(yōu)勢,在電力領(lǐng)域具有廣闊的應(yīng)用前景。筆者研究分析認為,需要從與現(xiàn)有技術(shù)應(yīng)用融合、算力的電力供應(yīng)和數(shù)字基礎(chǔ)設(shè)施的綠色發(fā)展等重點任務(wù)著手,推動DeepSeek與新型電力系統(tǒng)建設(shè)的深度融合,助力電力行業(yè)的智能化發(fā)展。
與現(xiàn)行大模型的融合應(yīng)用
持續(xù)開展行業(yè)大模型的迭代優(yōu)化,提升滿參數(shù)“光明”“大瓦特”等大模型的精準度,保障其作為“教師模型”的知識蒸餾技術(shù)效果。加強對DeepSeek所提出的強化學(xué)習(xí)、群體優(yōu)化、多頭潛在注意力和專家混合模型等技術(shù)理念的跟進學(xué)習(xí),推動前沿技術(shù)與各企業(yè)人工智能的有機結(jié)合。同時,推動DeepSeek長思維鏈推理與行業(yè)大模型的融合應(yīng)用,推動形成電力AI智能體。并將專業(yè)模型在電力規(guī)劃、電網(wǎng)調(diào)度、設(shè)備管理和營銷服務(wù)等場景中的應(yīng)用結(jié)果通過多模態(tài)學(xué)習(xí),作為DeepSeek的綜合性輸入,從不同維度對業(yè)務(wù)進行分析,提高分析結(jié)果的可靠性,根據(jù)DeepSeek的推理結(jié)果采取相應(yīng)的處置措施,輔助用戶完成工作。
對大模型的供電保障
雖然DeepSeek能夠以更聰明、更高效、更綠色的方式訓(xùn)練出AI模型,但人工智能的發(fā)展仍然離不開強大的算力與電力支撐,而算力和數(shù)據(jù)基礎(chǔ)設(shè)施的運行呈現(xiàn)高耗能特征,因此,需要做好大模型廣泛使用的電力需求預(yù)測。與其他大模型相比,DeepSeek更具分布式和實用性部署的優(yōu)勢,需要更為精準地預(yù)測分布式數(shù)據(jù)中心的能耗。在保障算力的電力供應(yīng)的同時,也要加強電力-算力規(guī)劃的協(xié)同,強化算力中心與配網(wǎng)的協(xié)同規(guī)劃設(shè)計,加強算力電力負荷的預(yù)測,促進電算兩側(cè)設(shè)備均在負載區(qū)間運行,研究算力中心靈活運行技術(shù),進一步探索算力中心參與源網(wǎng)荷儲協(xié)同互動的可行性。
算力基礎(chǔ)設(shè)施的綠色化低碳化發(fā)展
加快推進數(shù)字基礎(chǔ)設(shè)施的綠色化低碳化發(fā)展,探索綠電對算力中心的直供方式,推動零碳、低碳數(shù)據(jù)中心建設(shè)。加速制定數(shù)據(jù)中心的綠電直供政策,推動解決算力的綠電需求與新能源資源分布存在錯位的問題,針對新能源資源稟賦,有效調(diào)配訓(xùn)練算力分布,推動訓(xùn)練算力對綠電的就地消納;針對推理算力的區(qū)域性布局,圍繞分布式綠色能源系統(tǒng),盡快制定風(fēng)、光、氫等綠能建設(shè)的規(guī)劃。
當前,DeepSeek正加速融入全球各行各業(yè),也推動了我國電力行業(yè)向更加高效、安全、智能的方向邁進。電力行業(yè)要加強大模型前沿技術(shù)的跟進與研發(fā),進一步強化人工智能的自主可控,加強對DeepSeek強化學(xué)習(xí)、群體優(yōu)化、多頭潛在注意力和專家混合模型等技術(shù)理念的融合,發(fā)揮電力行業(yè)海量場景優(yōu)勢和產(chǎn)業(yè)鏈帶動作用,推動DeepSeek的技術(shù)路線和研發(fā)生態(tài)的不斷發(fā)展和完善,加速新型電力系統(tǒng)建設(shè),為經(jīng)濟社會高質(zhì)量發(fā)展保駕護航。