中國(guó)儲(chǔ)能網(wǎng)訊:今年初,杭州深度求索公司先后上線DeepSeek V3基座模型和專為復(fù)雜推理任務(wù)設(shè)計(jì)的DeepSeek R1模型,并同步開源開放,以卓越的性能超越或媲美全球頂級(jí)的開源及閉源模型,在美國(guó)和中國(guó)區(qū)域應(yīng)用商店下載量持續(xù)排名第一,引發(fā)了全球人工智能領(lǐng)域的廣泛關(guān)注與強(qiáng)烈反響。筆者認(rèn)為,需要提前研判DeepSeek廣泛應(yīng)用對(duì)新型電力系統(tǒng)建設(shè)與發(fā)展產(chǎn)生的影響,并采取相應(yīng)的措施確保能源安全,助力實(shí)現(xiàn)人工智能技術(shù)進(jìn)步,從而把握新一代人工智能帶來的各種機(jī)遇。
DeepSeek在各行業(yè)的應(yīng)用現(xiàn)狀
DeepSeek采用混合專家模型、多頭注意力機(jī)制和知識(shí)蒸餾技術(shù),大幅降低了大模型的訓(xùn)練和推理的算力需求,提升了模型效率,在數(shù)學(xué)、代碼和推理任務(wù)方面的性能能夠與OpenAI-o1相媲美,已在全球140多個(gè)國(guó)家和地區(qū)的應(yīng)用排行榜上登頂,并在各行業(yè)得到了廣泛應(yīng)用。
DeepSeek能引發(fā)行業(yè)震動(dòng)的核心原因是在效率和成本控制上的突破。DeepSeek通過模型結(jié)構(gòu)完善、訓(xùn)練方式優(yōu)化、底層算力調(diào)度等方面的系統(tǒng)級(jí)創(chuàng)新,在相對(duì)較低的算力投入下,獲得可媲美甚至超越頭部模型的性能表現(xiàn),實(shí)現(xiàn)了“低成本、高性能、準(zhǔn)推理”,打破以“大算力、大數(shù)據(jù)”為核心的生成式人工智能擴(kuò)展定律,將訓(xùn)練成本和能耗控制在頂尖大模型的1/20,訓(xùn)練成本僅為560萬美元,為探索通用人工智能開辟了新道路。DeepSeek的開源與低成本也促成了ChatGPT和“文心一言”等大模型的免費(fèi)應(yīng)用,有望改變閉源壟斷的市場(chǎng)格局,倒逼行業(yè)巨頭轉(zhuǎn)向開源生態(tài),有助于我國(guó)突破技術(shù)封鎖,開辟出一條“以開放破封鎖、以協(xié)作促創(chuàng)新”的中國(guó)AI發(fā)展路徑。
DeepSeek正以前所未有的速度應(yīng)用到各行各業(yè)。在政務(wù)領(lǐng)域,深圳、廣州、臨沂等多地政府已完成DeepSeek模型本地化部署。在互聯(lián)網(wǎng)行業(yè),國(guó)家超算互聯(lián)網(wǎng)平臺(tái)上線了從1.5b到70b的各級(jí)蒸餾模型;阿里云、百度云、華為云、騰訊云、天翼云等主流云平臺(tái)陸續(xù)官宣接入DeepSeek模型,提供多樣化的部署選項(xiàng)和服務(wù);硅基流動(dòng)等AI基礎(chǔ)設(shè)施廠商宣布適配并上架DeepSeek模型服務(wù)。在電信行業(yè),3家運(yùn)營(yíng)商均全面接入DeepSeek開源大模型。在金融行業(yè),已有16家券商、10余家公募基金公司以及多家銀行和保險(xiǎn)機(jī)構(gòu)完成接入或部署。在能源電力領(lǐng)域,“三桶油”、國(guó)家電網(wǎng)公司、南方電網(wǎng)公司及五大發(fā)電集團(tuán)均已完成DeepSeek私有化部署,并將其接入自身的數(shù)字平臺(tái)。
國(guó)外對(duì)Deepseek的數(shù)據(jù)安全與隱私保護(hù)仍持有謹(jǐn)慎態(tài)度。DeepSeek尚未建立透明的數(shù)據(jù)托管機(jī)制,其在線應(yīng)用會(huì)將用戶數(shù)據(jù)存儲(chǔ)在我國(guó)境內(nèi),因此遭到了部分歐美國(guó)家的抵制。美國(guó)國(guó)會(huì)議員以數(shù)據(jù)安全為由,提出一項(xiàng)兩黨法案禁止在聯(lián)邦政府的設(shè)備上使用DeepSeek。意大利數(shù)據(jù)保護(hù)局以缺乏DeepSeek應(yīng)用個(gè)人數(shù)據(jù)的具體方式為由,限制DeepSeek處理意大利用戶的數(shù)據(jù)。澳大利亞也以強(qiáng)制性指令禁止政府設(shè)備訪問DeepSeek,以杜絕數(shù)據(jù)泄露的隱患。
對(duì)新型電力系統(tǒng)建設(shè)的影響
DeepSeek通過用戶使用和行業(yè)應(yīng)用這兩條路徑對(duì)新型電力系統(tǒng)建設(shè)產(chǎn)生影響。一方面,電力用戶的廣泛應(yīng)用將通過模型訓(xùn)練推理的電力需求影響電力系統(tǒng)穩(wěn)定;另一方面,電力企業(yè)對(duì)DeepSeek的應(yīng)用,也將引發(fā)系統(tǒng)運(yùn)行和企業(yè)經(jīng)營(yíng)的系列變革,從而推動(dòng)新型電力系統(tǒng)建設(shè)。遵循以上兩個(gè)方向,筆者的研究團(tuán)隊(duì)從算力及電力需求、電網(wǎng)規(guī)劃、應(yīng)用效果和安全自主可控四個(gè)方面,深入分析DeepSeek對(duì)新型電力系統(tǒng)建設(shè)的影響。
一是DeepSeek的技術(shù)進(jìn)步或?qū)⒃黾诱w的算力及電力需求,為“綠電+算力中心”提供了發(fā)展空間。雖然DeepSeek通過優(yōu)化算法、硬件適配等技術(shù),顯著提升了人工智能算力效率,降低了單次任務(wù)的能耗,打破了人工智能應(yīng)用的經(jīng)濟(jì)門檻,但DeepSeek的技術(shù)進(jìn)步也將同步觸發(fā)“杰文斯悖論”,能源消耗總量或?qū)⑼黄凭€性增長(zhǎng)模式,形成“效率提升-應(yīng)用擴(kuò)張-能耗躍升”的閉環(huán)。一方面,DeepSeek的開源和低算力的特性,降低了大模型行業(yè)的準(zhǔn)入門檻,也將激發(fā)公眾的大模型應(yīng)用需求,從而引發(fā)整體算力增長(zhǎng)。DeepSeek弱化了國(guó)外對(duì)先進(jìn)算力的限制,將促進(jìn)更多的供應(yīng)商提供更為廣泛的服務(wù),同時(shí)也將激發(fā)用戶在本地部署大模型的需求。另一方面,DeepSeek依賴于高精度模型知識(shí)蒸餾技術(shù),需要有個(gè)復(fù)雜且性能優(yōu)異的“教師模型”將知識(shí)遷移到“學(xué)生模型”中。因此,需要大的算力來支撐高參數(shù)、高準(zhǔn)確性的“教師模型”訓(xùn)練?;谏鲜鰞蓚€(gè)因素,DeepSeek及其技術(shù)廣泛應(yīng)用之后,仍將引發(fā)算力和電力需求的快速上升,也需要綠色電力來保障算力中心的巨量電力需求。
二是DeepSeek的廣泛應(yīng)用將改變算力中心的負(fù)載分布,對(duì)配電網(wǎng)規(guī)劃和運(yùn)行產(chǎn)生一定沖擊。DeepSeek打破了原有數(shù)據(jù)中心市場(chǎng)格局的平衡,為市場(chǎng)帶來了新的競(jìng)爭(zhēng)力量。以往,大型數(shù)據(jù)中心憑借其雄厚的資金實(shí)力和先進(jìn)的技術(shù)設(shè)施,在AI計(jì)算服務(wù)領(lǐng)域占據(jù)主導(dǎo)地位,為大型科技公司提供定制化的算力支持。然而,DeepSeek可無視邊緣側(cè)數(shù)據(jù)中心算力低的劣勢(shì),并激發(fā)時(shí)延低和貼近應(yīng)用的優(yōu)勢(shì),推動(dòng)邊緣側(cè)數(shù)據(jù)中心承接延遲敏感的應(yīng)用需求,使得一些中小型數(shù)據(jù)中心也有機(jī)會(huì)參與到AI計(jì)算服務(wù)的競(jìng)爭(zhēng)中來,同時(shí)也迫使亞馬遜、阿里云等云計(jì)算巨頭調(diào)整部分大型數(shù)據(jù)中心的建設(shè)投入,轉(zhuǎn)而加強(qiáng)邊緣計(jì)算和分布式算力布局。邊緣側(cè)部署DeepSeek需要對(duì)應(yīng)的電力來驅(qū)動(dòng)服務(wù)器、存儲(chǔ)設(shè)備和網(wǎng)絡(luò)設(shè)備,導(dǎo)致整體能耗上升,易引發(fā)高峰期的電力供應(yīng)緊張,因此,需要提升配網(wǎng)承載能力,同時(shí)也要依靠大模型來提高電力分配和管理效率,以弱化因大模型而引發(fā)的電力供應(yīng)緊張。
三是DeepSeek與電力業(yè)務(wù)深度融合將為電力行業(yè)帶來深刻變革,進(jìn)一步優(yōu)化業(yè)務(wù)流程。相比其他的大模型,DeepSeek通過技術(shù)進(jìn)步有效提升了大模型的普惠性,推動(dòng)了大模型在工程場(chǎng)景中的規(guī)模化應(yīng)用,具有在電力行業(yè)海量運(yùn)行場(chǎng)景中深化應(yīng)用的潛力,并能提升專業(yè)模型的應(yīng)用效率,加強(qiáng)個(gè)性問題推理的邏輯性,實(shí)現(xiàn)在考慮全局情況下的最優(yōu)回答,不僅能作為一個(gè)智慧辦公助手,更有望成為一個(gè)綜合型的電力行業(yè)專家,可輔助業(yè)務(wù)人員完成對(duì)當(dāng)前問題的分析,給出解決方案。例如,在設(shè)備管理上,專業(yè)模型需要根據(jù)區(qū)域差異優(yōu)化相應(yīng)參數(shù),DeepSeek可以考慮區(qū)域地理、氣候等因素,輔助調(diào)試專業(yè)模型;在電網(wǎng)調(diào)度上,可以根據(jù)區(qū)域網(wǎng)架結(jié)構(gòu)和能源結(jié)構(gòu)特性完成調(diào)度指令輔助。
四是DeepSeek可更改底層代碼,實(shí)現(xiàn)差異化需求,確保電力大模型技術(shù)的自主可控和保障信息安全。電力行業(yè)作為國(guó)家的基礎(chǔ)性產(chǎn)業(yè),對(duì)核心技術(shù)國(guó)產(chǎn)化有著較高要求,實(shí)現(xiàn)國(guó)產(chǎn)化替代的需求十分迫切。DeepSeek作為國(guó)產(chǎn)的模型系統(tǒng),可以避免國(guó)內(nèi)電力系統(tǒng)與國(guó)外模型適配性低的問題,而且不同于閉源模型的技術(shù)壁壘,應(yīng)用企業(yè)可以深入了解模型的架構(gòu)和算法,并根據(jù)自身業(yè)務(wù)需求進(jìn)行深度改進(jìn)和優(yōu)化定制。同時(shí),DeepSeek在設(shè)計(jì)和開發(fā)過程中充分考慮了信息安全因素,因其源自國(guó)產(chǎn)模型系統(tǒng),研發(fā)和維護(hù)團(tuán)隊(duì)熟悉國(guó)內(nèi)應(yīng)用環(huán)境,能夠更好地遵循國(guó)家信息安全政策和標(biāo)準(zhǔn),減少了因外部因素導(dǎo)致的信息泄漏風(fēng)險(xiǎn),可以確保電力數(shù)據(jù)在采集、傳輸和分析過程中的安全性。
與新型電力系統(tǒng)建設(shè)深度融合的著力點(diǎn)
DeepSeek在訓(xùn)練效率、安全可控和精準(zhǔn)度上展現(xiàn)了較強(qiáng)的優(yōu)勢(shì),在電力領(lǐng)域具有廣闊的應(yīng)用前景。筆者研究分析認(rèn)為,需要從與現(xiàn)有技術(shù)應(yīng)用融合、算力的電力供應(yīng)和數(shù)字基礎(chǔ)設(shè)施的綠色發(fā)展等重點(diǎn)任務(wù)著手,推動(dòng)DeepSeek與新型電力系統(tǒng)建設(shè)的深度融合,助力電力行業(yè)的智能化發(fā)展。
與現(xiàn)行大模型的融合應(yīng)用
持續(xù)開展行業(yè)大模型的迭代優(yōu)化,提升滿參數(shù)“光明”“大瓦特”等大模型的精準(zhǔn)度,保障其作為“教師模型”的知識(shí)蒸餾技術(shù)效果。加強(qiáng)對(duì)DeepSeek所提出的強(qiáng)化學(xué)習(xí)、群體優(yōu)化、多頭潛在注意力和專家混合模型等技術(shù)理念的跟進(jìn)學(xué)習(xí),推動(dòng)前沿技術(shù)與各企業(yè)人工智能的有機(jī)結(jié)合。同時(shí),推動(dòng)DeepSeek長(zhǎng)思維鏈推理與行業(yè)大模型的融合應(yīng)用,推動(dòng)形成電力AI智能體。并將專業(yè)模型在電力規(guī)劃、電網(wǎng)調(diào)度、設(shè)備管理和營(yíng)銷服務(wù)等場(chǎng)景中的應(yīng)用結(jié)果通過多模態(tài)學(xué)習(xí),作為DeepSeek的綜合性輸入,從不同維度對(duì)業(yè)務(wù)進(jìn)行分析,提高分析結(jié)果的可靠性,根據(jù)DeepSeek的推理結(jié)果采取相應(yīng)的處置措施,輔助用戶完成工作。
對(duì)大模型的供電保障
雖然DeepSeek能夠以更聰明、更高效、更綠色的方式訓(xùn)練出AI模型,但人工智能的發(fā)展仍然離不開強(qiáng)大的算力與電力支撐,而算力和數(shù)據(jù)基礎(chǔ)設(shè)施的運(yùn)行呈現(xiàn)高耗能特征,因此,需要做好大模型廣泛使用的電力需求預(yù)測(cè)。與其他大模型相比,DeepSeek更具分布式和實(shí)用性部署的優(yōu)勢(shì),需要更為精準(zhǔn)地預(yù)測(cè)分布式數(shù)據(jù)中心的能耗。在保障算力的電力供應(yīng)的同時(shí),也要加強(qiáng)電力-算力規(guī)劃的協(xié)同,強(qiáng)化算力中心與配網(wǎng)的協(xié)同規(guī)劃設(shè)計(jì),加強(qiáng)算力電力負(fù)荷的預(yù)測(cè),促進(jìn)電算兩側(cè)設(shè)備均在負(fù)載區(qū)間運(yùn)行,研究算力中心靈活運(yùn)行技術(shù),進(jìn)一步探索算力中心參與源網(wǎng)荷儲(chǔ)協(xié)同互動(dòng)的可行性。
算力基礎(chǔ)設(shè)施的綠色化低碳化發(fā)展
加快推進(jìn)數(shù)字基礎(chǔ)設(shè)施的綠色化低碳化發(fā)展,探索綠電對(duì)算力中心的直供方式,推動(dòng)零碳、低碳數(shù)據(jù)中心建設(shè)。加速制定數(shù)據(jù)中心的綠電直供政策,推動(dòng)解決算力的綠電需求與新能源資源分布存在錯(cuò)位的問題,針對(duì)新能源資源稟賦,有效調(diào)配訓(xùn)練算力分布,推動(dòng)訓(xùn)練算力對(duì)綠電的就地消納;針對(duì)推理算力的區(qū)域性布局,圍繞分布式綠色能源系統(tǒng),盡快制定風(fēng)、光、氫等綠能建設(shè)的規(guī)劃。
當(dāng)前,DeepSeek正加速融入全球各行各業(yè),也推動(dòng)了我國(guó)電力行業(yè)向更加高效、安全、智能的方向邁進(jìn)。電力行業(yè)要加強(qiáng)大模型前沿技術(shù)的跟進(jìn)與研發(fā),進(jìn)一步強(qiáng)化人工智能的自主可控,加強(qiáng)對(duì)DeepSeek強(qiáng)化學(xué)習(xí)、群體優(yōu)化、多頭潛在注意力和專家混合模型等技術(shù)理念的融合,發(fā)揮電力行業(yè)海量場(chǎng)景優(yōu)勢(shì)和產(chǎn)業(yè)鏈帶動(dòng)作用,推動(dòng)DeepSeek的技術(shù)路線和研發(fā)生態(tài)的不斷發(fā)展和完善,加速新型電力系統(tǒng)建設(shè),為經(jīng)濟(jì)社會(huì)高質(zhì)量發(fā)展保駕護(hù)航。