中國儲(chǔ)能網(wǎng)訊:日前,國家網(wǎng)信辦約談?dòng)ミ_(dá)公司,再次敲響了要發(fā)展自主可控國產(chǎn)算力的警鐘。在2025世界人工智能大會(huì)上,英國皇家工程院院士郭毅可在演講中指出,全球AI算力需求正以每兩年750倍的速率極速擴(kuò)張,中國云端AI芯片市場預(yù)計(jì)將在2027年突破480億美元規(guī)模,國產(chǎn)GPU市占率預(yù)計(jì)超80%。
從“可用”走向“好用”
GPU芯片在個(gè)人計(jì)算機(jī)、云計(jì)算、人工智能、安防監(jiān)控等領(lǐng)域有著廣泛的應(yīng)用。此前,全球GPU市場由英偉達(dá)、AMD、英特爾三大廠商壟斷。
國產(chǎn)GPU代表廠商有摩爾線程、燧原科技、壁仞科技、沐曦等。其中,摩爾線程、沐曦等明星獨(dú)角獸集中在2020年前后成立,主要面向圖形渲染和AI計(jì)算進(jìn)行技術(shù)布局。今年6月30日,摩爾線程和沐曦同時(shí)向上交所遞交了招股說明書。
從目前的情況來看,部分國產(chǎn)GPU產(chǎn)品在性能上已經(jīng)取得了一定進(jìn)步,如壁仞科技的BR100系列GPU,其峰值算力超過了英偉達(dá)目前在售的旗艦計(jì)算產(chǎn)品A100GPU的3倍,并創(chuàng)造了全球通用GPU的算力記錄,能夠滿足一些對(duì)算力要求較高的應(yīng)用場景需求。
同時(shí),越來越多的國產(chǎn)GPU廠商意識(shí)到生態(tài)建設(shè)的重要性,并積極與上下游企業(yè)、科研機(jī)構(gòu)等展開合作,共同構(gòu)建完整的產(chǎn)業(yè)生態(tài)。例如,摩爾線程與眾多行業(yè)合作伙伴聯(lián)合展示了基于其智算集群的豐富行業(yè)大模型應(yīng)用方案,推動(dòng)了國產(chǎn)GPU在各領(lǐng)域的應(yīng)用和發(fā)展。
在人工智能熱潮帶動(dòng)下,我國算力需求呈爆發(fā)式增長,算力產(chǎn)業(yè)正迎來加速演進(jìn)的戰(zhàn)略機(jī)遇期,也為國產(chǎn)GPU提供了廣闊的市場前景。
近日召開的國務(wù)院常務(wù)會(huì)議通過了《關(guān)于深入實(shí)施“人工智能+”行動(dòng)的意見》。會(huì)議指出,“要著力優(yōu)化人工智能創(chuàng)新生態(tài),強(qiáng)化算力、算法和數(shù)據(jù)供給……”在地方層面,上海、北京等多地已先后出臺(tái)政策,在算力、運(yùn)力、存儲(chǔ)方面均有明確規(guī)劃,例如,上海印發(fā)《上海市進(jìn)一步擴(kuò)大人工智能應(yīng)用的若干措施》,其中提到,降低智能算力使用成本,發(fā)放6億元算力券,加強(qiáng)算力調(diào)度平臺(tái)建設(shè),體系化支持企業(yè)研發(fā)和應(yīng)用大模型,加快大模型生態(tài)空間集聚。從國家到地方,政策紅利持續(xù)釋放。
國產(chǎn)高性能GPU顯卡需求迫切
現(xiàn)在GPU主要可以分成兩大類。一類是大家比較熟悉的,用來玩游戲、做圖形渲染的顯卡,像英偉達(dá)或者AMD等常見的游戲顯卡就是這個(gè)類型。另一類是專門用來加速AI計(jì)算,例如訓(xùn)練大模型、做深度學(xué)習(xí)等,就需要這種專門的AI加速卡。
2024年,全球GPU市場已經(jīng)達(dá)到了1000億美元,市場空間巨大,中國約占1/4份額,但高端產(chǎn)品仍受制于人。
我國企業(yè)在GPU領(lǐng)域起步較晚,技術(shù)積累和市場份額都無法與英偉達(dá)相提并論。英偉達(dá)早在1999年就推出了首款GPU,并在此后的20多年里不斷迭代升級(jí),形成了強(qiáng)大的技術(shù)壁壘。更重要的是,英偉達(dá)不僅僅是一家硬件公司,它還構(gòu)建了一個(gè)龐大的軟件生態(tài)。
相比之下,國產(chǎn)GPU的發(fā)展歷程要短得多,軟件生態(tài)也相對(duì)薄弱,不過,盡管困難重重,國產(chǎn)GPU并沒有停下追趕的腳步。近年來,相關(guān)部門對(duì)半導(dǎo)體產(chǎn)業(yè)的支持力度加大,大量資金也紛紛涌入GPU賽道,這為國產(chǎn)GPU的研發(fā)和商業(yè)化提供了有力支撐。一些國產(chǎn)GPU企業(yè)已經(jīng)開始在特定領(lǐng)域取得突破,比如圖形渲染、邊緣計(jì)算等,逐步積累技術(shù)和市場經(jīng)驗(yàn)。
國產(chǎn)GPU的瓶頸在哪
人工智能時(shí)代,GPU作為核心驅(qū)動(dòng)力,重要性不言而喻。然而,國產(chǎn)GPU在前進(jìn)的道路上卻面臨著諸多阻礙,發(fā)展現(xiàn)狀不容樂觀。
中國工程院院士劉韻潔表示,中國在單卡GPU性能上無法和國外競爭,起碼短時(shí)間內(nèi)做不到。與海外的GPU相比,國產(chǎn)GPU可能需要堆疊更多的量才能達(dá)到相同的算力水平,這也是為什么需要打造萬卡規(guī)模算力。然而,就像管理一萬人比管理一千人要難得多,打造萬卡規(guī)模的算力集群面臨諸多挑戰(zhàn)。
電信運(yùn)營商通常是算力設(shè)施的投資方或運(yùn)營方。在過去一年里,中國電信在上海和北京建了兩個(gè)國產(chǎn)萬卡公共智算中心,算力規(guī)模分別是3.5EFLOPS和3.75EFLOPS。2024年8月,中國移動(dòng)在哈爾濱1.8萬卡規(guī)模的超大智算中心,算力規(guī)模是6.9EFLOPS。
針對(duì)萬卡規(guī)模帶來的技術(shù)挑戰(zhàn),包括智算互聯(lián)GSE(全調(diào)度以太網(wǎng))和OISA(全向智感互聯(lián))產(chǎn)業(yè)鏈攻堅(jiān)計(jì)劃等。
簡單來說,這是為了把上萬張GPU卡和上千臺(tái)服務(wù)器互聯(lián)起來,并讓它們之間快速通信以傳輸數(shù)據(jù),還要確保它們長時(shí)間運(yùn)行時(shí)穩(wěn)定,不會(huì)中斷。當(dāng)出現(xiàn)故障時(shí)能快速找到故障點(diǎn)并讓AI輔助診斷。
隨著AI大模型的迅速發(fā)展,我們?nèi)匀幻媾R高質(zhì)量算力供給和國產(chǎn)高端芯片短缺的挑戰(zhàn)。然而,我國企業(yè)正在逐步減少對(duì)外部企業(yè)的依賴,只要持續(xù)投入研發(fā)、完善生態(tài),國產(chǎn)GPU實(shí)現(xiàn)自主可控并非遙不可及?;蛟S在不久的將來,我們能看到國產(chǎn)GPU在高端市場與頭部企業(yè)一較高下,真正擺脫“卡脖子”的風(fēng)險(xiǎn)。