中國(guó)儲(chǔ)能網(wǎng)訊:曾經(jīng),面對(duì)“什么東西看不見(jiàn)摸不著,卻時(shí)刻影響人們生活”的問(wèn)題,許多人會(huì)脫口而出“空氣”。如今,“算力”也成為不少人心中的答案。數(shù)字時(shí)代,算力已然像水、電、燃?xì)庖粯颖憬菘捎?。曾?jīng),面對(duì)“什么東西看不見(jiàn)摸不著,卻時(shí)刻影響人們生活”的問(wèn)題,許多人會(huì)脫口而出“空氣”。如今,“算力”也成為不少人心中的答案。數(shù)字時(shí)代,算力已然像水、電、燃?xì)庖粯颖憬菘捎谩?
織就數(shù)字時(shí)代的算力網(wǎng)
5月,工業(yè)和信息化部等六部門(mén)聯(lián)合發(fā)布的《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)計(jì)劃》(以下簡(jiǎn)稱《行動(dòng)計(jì)劃》)提出,要“探索構(gòu)建布局合理、泛在連接、靈活高效的算力互聯(lián)網(wǎng)”。近日,我國(guó)正式啟動(dòng)“算力互聯(lián)網(wǎng)試驗(yàn)網(wǎng)”建設(shè),拉開(kāi)了構(gòu)建數(shù)字經(jīng)濟(jì)時(shí)代新型信息基礎(chǔ)設(shè)施的序幕。
算力互聯(lián)網(wǎng),顧名思義是給算力搭建一個(gè)網(wǎng)絡(luò)空間,就像Internet(互聯(lián)網(wǎng))連通全球的網(wǎng)友和設(shè)備一樣,現(xiàn)在我們要把全國(guó)的算力都串聯(lián)起來(lái)。
“算力互聯(lián)網(wǎng)并不是一張新的網(wǎng)絡(luò),而是在現(xiàn)有互聯(lián)網(wǎng)基礎(chǔ)上,將分散在各地的算力資源連接在網(wǎng)上,通過(guò)標(biāo)準(zhǔn)化的算力標(biāo)識(shí)和協(xié)議接口,跨域資源互聯(lián)網(wǎng)絡(luò),實(shí)現(xiàn)全網(wǎng)異構(gòu)算力的智能感知、實(shí)時(shí)發(fā)現(xiàn)、隨需獲取。”中國(guó)信息通信研究院院長(zhǎng)余曉暉說(shuō)道,和以往的網(wǎng)絡(luò)互聯(lián)互通不同,算力互聯(lián)互通更加側(cè)重供需之間的互聯(lián),其目的是實(shí)現(xiàn)人工智能、科學(xué)計(jì)算、工業(yè)計(jì)算等計(jì)算任務(wù)在本地算力資源不足或隨時(shí)隨地隨需使用算力時(shí),計(jì)算任務(wù)及其數(shù)據(jù)可以流動(dòng)到另一個(gè)算力池進(jìn)行計(jì)算,實(shí)現(xiàn)算力資源智能感知、實(shí)時(shí)發(fā)現(xiàn)和隨需獲取,使算力像水、電一樣便捷使用。
就像電力讓燈泡發(fā)光,算力也是AI的“燃料”。算力產(chǎn)業(yè)已被納入國(guó)家重要發(fā)展戰(zhàn)略。從2024年“加快形成全國(guó)一體化算力體系”到2025年“優(yōu)化算力資源布局”,政府工作報(bào)告連續(xù)兩年強(qiáng)調(diào)算力產(chǎn)業(yè)高質(zhì)量發(fā)展的重要性。
算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展需要各級(jí)政府以及基礎(chǔ)電信運(yùn)營(yíng)商、第三方數(shù)據(jù)中心服務(wù)商、互聯(lián)網(wǎng)企業(yè)等各類市場(chǎng)主體在算力基礎(chǔ)設(shè)施建設(shè)運(yùn)營(yíng)中發(fā)揮各自優(yōu)勢(shì),互促互補(bǔ)、形成合力。如今,包括電信運(yùn)營(yíng)商、云服務(wù)巨頭、智算中心、科研機(jī)構(gòu)在內(nèi)的多方力量已紛紛入局,共同織就這張未來(lái)的“算力之網(wǎng)”。
從“資源孤島”到“一云多芯 ” 算力互聯(lián)網(wǎng)破局而生
如果說(shuō)數(shù)據(jù)是數(shù)字經(jīng)濟(jì)的“石油”,那么算力就是驅(qū)動(dòng)這一切運(yùn)轉(zhuǎn)的“引擎”。算力是集信息計(jì)算力、網(wǎng)絡(luò)運(yùn)載力、數(shù)據(jù)存儲(chǔ)力于一體的新型生產(chǎn)力,主要通過(guò)算力基礎(chǔ)設(shè)施向社會(huì)提供服務(wù)。從AIGC(人工智能生成內(nèi)容)的驚艷問(wèn)世,到自動(dòng)駕駛汽車(chē)的決策,再到新藥研發(fā)周期的大幅縮短,都離不開(kāi)海量算力的支撐。算力,已不再是少數(shù)科研機(jī)構(gòu)的專屬工具,而是驅(qū)動(dòng)社會(huì)創(chuàng)新和產(chǎn)業(yè)升級(jí)的核心生產(chǎn)力。
如最近爆火的電視劇《長(zhǎng)安的荔枝》所描述的那樣,嶺南盛產(chǎn)荔枝(算力),遠(yuǎn)在長(zhǎng)安的楊貴妃想吃荔枝,就命令人在鮮荔枝腐壞前將其從嶺南轉(zhuǎn)運(yùn)至長(zhǎng)安。算力也得在數(shù)據(jù)“超時(shí)”前完成調(diào)度與計(jì)算。
“我國(guó)數(shù)據(jù)中心和算力資源總體上呈現(xiàn)‘東部需求旺盛,西部資源富集’的格局,需要通過(guò)構(gòu)建新型算力網(wǎng)絡(luò)體系,將東部算力需求有序引導(dǎo)到西部,優(yōu)化數(shù)據(jù)中心建設(shè)布局?!敝袊?guó)工程院院士劉韻潔在多個(gè)場(chǎng)合強(qiáng)調(diào),構(gòu)建全國(guó)一體化的算力網(wǎng)絡(luò)體系是應(yīng)對(duì)當(dāng)前挑戰(zhàn)的必然選擇。
長(zhǎng)期以來(lái),各地的計(jì)算中心、數(shù)據(jù)中心如同一個(gè)個(gè)“資源孤島”,技術(shù)體系各異,標(biāo)準(zhǔn)難以統(tǒng)一,導(dǎo)致算力無(wú)法在更廣闊的范圍內(nèi)高效流通和共享。
在談及行業(yè)痛點(diǎn)時(shí),聯(lián)通數(shù)科云計(jì)算事業(yè)部云管平臺(tái)部總經(jīng)理溫源也表達(dá)了類似的看法:“當(dāng)前行業(yè)面臨的主要阻礙,是算力資源碎片化、供需錯(cuò)配問(wèn)題突出,導(dǎo)致資源利用率不高。算力互聯(lián)網(wǎng)正是為了解決這些核心問(wèn)題而生?!彼唧w闡述道,“首先是整合異構(gòu)資源,通過(guò)統(tǒng)一的調(diào)度平臺(tái)和標(biāo)準(zhǔn)接口,納管通算、智算、超算,打破‘算力孤島’;其次是實(shí)現(xiàn)智能匹配供需,平臺(tái)可以按任務(wù)需求動(dòng)態(tài)匹配最優(yōu)資源,例如在‘中訓(xùn)邊推’(中部訓(xùn)練、邊緣推理)場(chǎng)景中,聯(lián)通打造的‘星羅’調(diào)度平臺(tái)能夠?qū)崿F(xiàn)任務(wù)與資源毫秒級(jí)匹配;最終實(shí)現(xiàn)降本增效,降低用戶獲取算力的門(mén)檻和成本,提升資源周轉(zhuǎn)率?!?/span>
與此同時(shí),以大模型為代表的AI技術(shù)浪潮,為算力互聯(lián)網(wǎng)的發(fā)展按下了“快進(jìn)鍵”。據(jù)OpenAI分析,自2012年以來(lái),全球頭部AI模型訓(xùn)練算力需求每3至4個(gè)月便翻一番,增長(zhǎng)曲線極為陡峭。這種對(duì)巨量智能算力的“饑渴”,讓算力互聯(lián)網(wǎng)的價(jià)值越發(fā)凸顯。
溫源認(rèn)為,算力互聯(lián)網(wǎng)正是滿足AI時(shí)代算力需求的理想架構(gòu)。他指出,大模型對(duì)算力互聯(lián)網(wǎng)提出了新要求和新挑戰(zhàn),“例如,千億級(jí)模型訓(xùn)練需要TB級(jí)的帶寬和毫秒級(jí)的時(shí)延互聯(lián),同時(shí)需要支持像‘西訓(xùn)東推’‘中訓(xùn)邊推’等復(fù)雜的調(diào)度場(chǎng)景?!倍懔ヂ?lián)網(wǎng)恰好能發(fā)揮獨(dú)特優(yōu)勢(shì),“以聯(lián)通的實(shí)踐為例,我們依托400GROADM的全光底座,可以實(shí)現(xiàn)樞紐間毫秒級(jí)的時(shí)延直連;通過(guò)‘星羅’平臺(tái)的智能調(diào)度,能夠動(dòng)態(tài)分配訓(xùn)練和推理任務(wù),使資源利用率達(dá)到75%以上;再結(jié)合‘東數(shù)西算’的布局,將訓(xùn)練任務(wù)調(diào)度至呼和浩特等西部低碳樞紐,可將PUE(電源使用效率)降低至1.2以下?!?/span>
除了中國(guó)聯(lián)通,各大廠商也正從不同路徑探索解決方案,共同推動(dòng)算力互聯(lián)網(wǎng)從理念走向現(xiàn)實(shí)。
阿里云很早就開(kāi)始了對(duì)大規(guī)模、分布式計(jì)算的探索。其自研的“飛天”(Apsara)云操作系統(tǒng),本質(zhì)上就是一套為統(tǒng)一管理和調(diào)度百萬(wàn)級(jí)服務(wù)器而設(shè)計(jì)的“超級(jí)計(jì)算機(jī)”操作系統(tǒng)。在算力互聯(lián)網(wǎng)時(shí)代,阿里云正將其“公共云”的能力延伸,構(gòu)建一個(gè)開(kāi)放的算力調(diào)度體系。
面對(duì)來(lái)自英偉達(dá)、AMD以及國(guó)產(chǎn)芯片廠商,如海光、寒武紀(jì)等的異構(gòu)算力,阿里云通過(guò)CIPU這一專用處理器,將網(wǎng)絡(luò)、存儲(chǔ)、安全等基礎(chǔ)設(shè)施能力從CPU中卸載,并對(duì)上層提供標(biāo)準(zhǔn)化的接口。這使得無(wú)論底層芯片如何變化,上層應(yīng)用都能獲得一致、高性能的算力服務(wù)。
騰訊云則將重點(diǎn)放在了打造極致性能的“運(yùn)載力”上。其推出的新一代算力網(wǎng)絡(luò)“星脈網(wǎng)絡(luò)”,是專門(mén)為AI和高性能計(jì)算場(chǎng)景設(shè)計(jì)的。
該網(wǎng)絡(luò)通過(guò)自研的網(wǎng)絡(luò)設(shè)備和擁塞控制算法,實(shí)現(xiàn)了3.2TB的超高端口帶寬和跨區(qū)域低至毫秒級(jí)的通信延遲。
華為云的算力互聯(lián)網(wǎng)戰(zhàn)略,深深植根于其“云邊端協(xié)同”的理念。其目標(biāo)是構(gòu)建一張無(wú)處不在的、架構(gòu)統(tǒng)一的算力網(wǎng)絡(luò),覆蓋中心云、邊緣節(jié)點(diǎn)乃至終端設(shè)備。這一戰(zhàn)略的核心是其“昇騰”(Ascend)AI計(jì)算架構(gòu)和分布式云基礎(chǔ)設(shè)施“擎天”(QingTian)架構(gòu)。
通過(guò)“擎天”架構(gòu),華為云能夠?qū)⒉渴鹪谌珖?guó)各地的昇騰AI算力中心(如武漢、西安、深圳的人工智能計(jì)算中心)進(jìn)行邏輯上的統(tǒng)一資源化,形成一個(gè)巨大的分布式算力池。
用戶無(wú)需關(guān)心物理位置,即可通過(guò)華為云的統(tǒng)一入口,調(diào)用最優(yōu)的算力資源。這種模式尤其適用于自動(dòng)駕駛、工業(yè)質(zhì)檢等需要低延遲邊緣計(jì)算和高強(qiáng)度中心訓(xùn)練協(xié)同的場(chǎng)景。模型在中心的昇騰集群上完成訓(xùn)練,然后一鍵推送到遍布全國(guó)的邊緣節(jié)點(diǎn)進(jìn)行實(shí)時(shí)推理。
除了商業(yè)公司,以鵬城實(shí)驗(yàn)室為代表的國(guó)家級(jí)科研機(jī)構(gòu)也在算力互聯(lián)網(wǎng)的建設(shè)中扮演著關(guān)鍵角色。其研發(fā)的“鵬城云腦”系列,特別是“鵬城云腦Ⅱ”,是全球首個(gè)E級(jí)(每秒百億億次)AI計(jì)算平臺(tái),也是我國(guó)在算力網(wǎng)絡(luò)領(lǐng)域的重大戰(zhàn)略部署。
“鵬城云腦”不僅自身算力強(qiáng)大,更重要的使命是作為中國(guó)算力網(wǎng)的核心節(jié)點(diǎn),探索如何將全國(guó)各大超算中心、智算中心進(jìn)行高速互聯(lián)和協(xié)同調(diào)度。
從標(biāo)準(zhǔn)到算法 疏通算力輸送“大動(dòng)脈”
想要富,先修路。而在算力產(chǎn)業(yè)中,網(wǎng)絡(luò)也是算力的路。
以中國(guó)聯(lián)通為代表的電信運(yùn)營(yíng)商,憑借得天獨(dú)厚的網(wǎng)絡(luò)優(yōu)勢(shì)和廣泛的算力節(jié)點(diǎn)布局,在算力互聯(lián)網(wǎng)中扮演著不可或缺的角色?!白鳛檫\(yùn)營(yíng)商,我們的核心優(yōu)勢(shì)在于‘云網(wǎng)融合’。網(wǎng)絡(luò)是算力的‘輸送帶’,只有把‘路’修好,算力才能跑得快、跑得穩(wěn)?!睖卦磸?qiáng)調(diào)。他詳細(xì)介紹了中國(guó)聯(lián)通基于“四位一體”架構(gòu)的核心優(yōu)勢(shì):
“第一是全光底座,我們的400GROADM網(wǎng)絡(luò)已覆蓋22個(gè)省,實(shí)現(xiàn)了算力樞紐間低于24ms的直連時(shí)延;第二是智能化產(chǎn)業(yè)互聯(lián)網(wǎng),通過(guò)SRv6+SDN技術(shù)實(shí)現(xiàn)業(yè)務(wù)級(jí)的SLA(服務(wù)水平協(xié)議)保障;第三是‘星羅’調(diào)度平臺(tái),它能夠納管多元異構(gòu)算力,使整體調(diào)度效率提升40%;第四是雙引擎基座,以裸金屬+容器化的雙棧架構(gòu)支撐通用計(jì)算和智能計(jì)算的混合部署?!?/span>
“星羅”先進(jìn)算力調(diào)度平臺(tái),是聯(lián)通這套體系的“智慧大腦”。當(dāng)被問(wèn)及平臺(tái)的實(shí)際運(yùn)作時(shí),溫源以“中訓(xùn)邊推”場(chǎng)景為例介紹道:“首先平臺(tái)會(huì)進(jìn)行任務(wù)拆分,比如將模型訓(xùn)練任務(wù)調(diào)度到西部的超算中心(如呼和浩特),同時(shí)將推理任務(wù)下沉至更靠近用戶的邊緣節(jié)點(diǎn);然后是資源匹配,通過(guò)算力標(biāo)識(shí)解析來(lái)定位最優(yōu)資源,并結(jié)合網(wǎng)絡(luò)狀態(tài)動(dòng)態(tài)選擇最佳路徑;最后是數(shù)據(jù)加速,基于高通量數(shù)據(jù)傳輸技術(shù),顯著提升跨域傳輸?shù)男省!?/span>
實(shí)現(xiàn)“算力如水,隨取隨用”的美好愿景,道阻且長(zhǎng)。異構(gòu)算力納管、海量數(shù)據(jù)安全高效流通、調(diào)度算法的公平與效率、綠色低碳等,都是擺在全行業(yè)面前的技術(shù)難題。
“這些挑戰(zhàn)是系統(tǒng)性的,需要產(chǎn)業(yè)鏈上下游共同努力,從標(biāo)準(zhǔn)、技術(shù)、架構(gòu)等多個(gè)維度進(jìn)行創(chuàng)新突破。”溫源表示。
在解決海量數(shù)據(jù)傳輸?shù)膯?wèn)題上,構(gòu)建一張泛在、彈性、高性能的網(wǎng)絡(luò)底座是關(guān)鍵。溫源介紹道:“在海量數(shù)據(jù)傳輸方面,我們開(kāi)展了‘?dāng)?shù)據(jù)快遞’新業(yè)務(wù),利用中國(guó)聯(lián)通高通量的網(wǎng)絡(luò)(400G骨干網(wǎng)+SRv6)來(lái)打造實(shí)現(xiàn)海量數(shù)據(jù)傳輸?shù)慕鉀Q方案,實(shí)現(xiàn)了傳輸效率的有效提升?!?/span>
任務(wù)調(diào)度是算力互聯(lián)網(wǎng)的核心,也是難點(diǎn)所在。面對(duì)這一挑戰(zhàn),產(chǎn)業(yè)界正在積極探索。溫源介紹了聯(lián)通為實(shí)現(xiàn)“算力水電化”愿景所探索的實(shí)踐路徑:“首先是架構(gòu)創(chuàng)新,我們正在構(gòu)建‘算力調(diào)度+光網(wǎng)絡(luò)’聯(lián)動(dòng)的算網(wǎng)大腦;其次是算法突破,通過(guò)研發(fā)智能調(diào)度算法,能夠減少30%的冗余數(shù)據(jù)遷移;最后是網(wǎng)絡(luò)升級(jí),我們已開(kāi)展試點(diǎn)800G超高速傳輸技術(shù),向?qū)崿F(xiàn)全光網(wǎng)2.0邁進(jìn)?!?/span>
發(fā)展算力互聯(lián)網(wǎng) 還需越過(guò)幾道坎
技術(shù)最終的價(jià)值應(yīng)該體現(xiàn)在應(yīng)用之中。算力互聯(lián)網(wǎng)正催生出一系列新業(yè)態(tài)、新應(yīng)用,為千行百業(yè)和個(gè)人用戶帶來(lái)前所未有的體驗(yàn)。
在消費(fèi)端,云手機(jī)、云電腦、AI作畫(huà)等應(yīng)用,都需要強(qiáng)大的云端算力實(shí)時(shí)渲染和計(jì)算。算力互聯(lián)網(wǎng)的普及,將讓這些高性能服務(wù)變得更加流暢和親民。
然而,發(fā)展算力互聯(lián)網(wǎng),仍然面臨較大的挑戰(zhàn)。我國(guó)算力互聯(lián)網(wǎng)尚處于發(fā)展初期,當(dāng)前算力調(diào)度更多僅限于算力卡資源的簡(jiǎn)單分配。要真正實(shí)現(xiàn)不同架構(gòu)、不同主體、不同地域的多元算力互聯(lián)互通,實(shí)現(xiàn)算力資源的動(dòng)態(tài)調(diào)配和自動(dòng)優(yōu)化,主要面臨四方面挑戰(zhàn):
一是技術(shù)體系有待完善,二是數(shù)據(jù)流通仍存堵點(diǎn),三是商業(yè)模式不成熟,四是發(fā)展機(jī)制有待健全。
“當(dāng)前,我國(guó)各類算力提供主體超5000家且多元化,其技術(shù)體系、基礎(chǔ)架構(gòu)、調(diào)用接口、資源描述等存在差異,建成的算力沒(méi)有形成全國(guó)范圍內(nèi)可感知和可調(diào)度的標(biāo)準(zhǔn)化算力服務(wù),用戶因此也難以快速找到位置、成本、性能均合適的算力資源,供需無(wú)法高效對(duì)接。”余曉暉直言,如何在多元化算力供給的狀況下統(tǒng)合形成標(biāo)準(zhǔn)化可調(diào)度的算力服務(wù),是當(dāng)務(wù)之急。產(chǎn)業(yè)界在積極開(kāi)展算力互聯(lián)路徑探索,但由于缺乏統(tǒng)一算力資源感知、任務(wù)數(shù)據(jù)流動(dòng)、應(yīng)用架構(gòu)適配等關(guān)鍵互聯(lián)規(guī)則和標(biāo)準(zhǔn),總體還是“算力局域網(wǎng)”分別發(fā)展的局面,未能形成全國(guó)全域的統(tǒng)一算力服務(wù)大市場(chǎng)。
《行動(dòng)計(jì)劃》明確了“兩步走”目標(biāo),并制定了6方面16項(xiàng)重點(diǎn)任務(wù),包括筑牢算力互聯(lián)基礎(chǔ)、優(yōu)化算力設(shè)施互聯(lián)、促進(jìn)算力資源互用、創(chuàng)新算力業(yè)務(wù)互通、打造算力互聯(lián)應(yīng)用場(chǎng)景、夯實(shí)算力網(wǎng)絡(luò)和數(shù)據(jù)安全保障。
“從長(zhǎng)遠(yuǎn)來(lái)看,推動(dòng)算力互聯(lián)網(wǎng)像水、電、網(wǎng)一樣即插即用、按需付費(fèi),是我們這一代信息通信人的使命?!睖卦催@樣總結(jié)道。當(dāng)算力真正像水電一樣觸手可及,我們將迎來(lái)一個(gè)算力驅(qū)動(dòng)創(chuàng)新的新時(shí)代。