中國儲(chǔ)能網(wǎng)訊:近日,北京大學(xué)人工智能研究院孫仲研究員團(tuán)隊(duì)聯(lián)合集成電路學(xué)院研究團(tuán)隊(duì),成功研制出基于阻變存儲(chǔ)器的高精度、可擴(kuò)展模擬矩陣計(jì)算芯片,首次實(shí)現(xiàn)了在精度上可與數(shù)字計(jì)算媲美的模擬計(jì)算系統(tǒng),相關(guān)成果10月13日刊發(fā)于《自然·電子學(xué)》期刊。據(jù)報(bào)道,該款芯片在求解大規(guī)模MIMO信號(hào)檢測(cè)等關(guān)鍵科學(xué)問題時(shí),計(jì)算吞吐量與能效較當(dāng)前頂級(jí)數(shù)字處理器(GPU)提升百倍至千倍。
這樣一則技術(shù)性極強(qiáng)的新聞“刷屏”各大媒體平臺(tái),其“破圈”背后不僅僅是芯片技術(shù)的重大突破,更因?yàn)樗鼡糁辛水?dāng)前數(shù)字算力增長(zhǎng)放緩、能耗激增的全球性痛點(diǎn),為AI、自動(dòng)駕駛等關(guān)鍵領(lǐng)域的算力困境提供了一個(gè)全新的解決思路。
從算不準(zhǔn)到精準(zhǔn)計(jì)算的復(fù)興
據(jù)了解,數(shù)字計(jì)算的統(tǒng)治地位并非與生俱來。在計(jì)算機(jī)的早期歲月里,模擬計(jì)算曾是絕對(duì)主流,它通過連續(xù)的物理量直接表達(dá)和處理信息。然而,隨著計(jì)算任務(wù)日益復(fù)雜,模擬計(jì)算在精度和擴(kuò)展性上的局限日益凸顯,最終讓位于能夠提供絕對(duì)精確結(jié)果的數(shù)字計(jì)算。孫仲談到:“如何讓模擬計(jì)算兼具高精度與可擴(kuò)展性,從而在現(xiàn)代計(jì)算任務(wù)中發(fā)揮先天優(yōu)勢(shì),一直是困擾全球科學(xué)界的‘世紀(jì)難題’?!?
對(duì)于大多數(shù)習(xí)慣數(shù)字計(jì)算機(jī)(二進(jìn)制)的公眾而言,模擬計(jì)算是一個(gè)既古老又新奇的概念。孫仲用生動(dòng)的比喻對(duì)其進(jìn)行解釋:“現(xiàn)在的所有芯片都是數(shù)字計(jì)算,數(shù)據(jù)需先轉(zhuǎn)換成0和1的符號(hào)串。比如,數(shù)字‘十’,需要轉(zhuǎn)譯成‘1’和‘0’,計(jì)為‘1010’?!蓖瑯拥兀绻枚M(jìn)制來表示“1+1=2”,則應(yīng)記作“1+1=10”。
模擬計(jì)算則無需這層“轉(zhuǎn)譯”,它是一種“類比計(jì)算”。一位模擬芯片企業(yè)相關(guān)負(fù)責(zé)人對(duì)記者解釋說,傳統(tǒng)模擬芯片的“模擬”,是將自然界的物理常量信號(hào)(例如聲、光、熱等),模擬成同樣是常量的電信號(hào)(電壓、電流)。也就是說,數(shù)字“十”,可以直接用10伏或10毫伏的電壓來表示。模擬芯片通常處理的都是這種電信號(hào),然后通過模擬數(shù)字轉(zhuǎn)換器(ADC)將之轉(zhuǎn)換為數(shù)字信號(hào),傳輸至CPU/MCU進(jìn)行計(jì)算處理。
模擬計(jì)算機(jī)在計(jì)算機(jī)發(fā)展早期(上世紀(jì)30~60年代)曾被廣泛應(yīng)用,但隨著計(jì)算任務(wù)日益復(fù)雜,其精度瓶頸凸顯,逐漸被數(shù)字計(jì)算取代。孫仲指出,此次研究的核心正是要解決模擬計(jì)算“算不準(zhǔn)”這一痛點(diǎn)。
據(jù)悉,研究團(tuán)隊(duì)在試驗(yàn)中成功實(shí)現(xiàn)了16×16矩陣的24比特定點(diǎn)數(shù)精度求逆,矩陣方程求解經(jīng)過10次迭代后,相對(duì)誤差可低至10<sup>﹣7</sup>量級(jí)。這種精度水平足以滿足絕大多數(shù)科學(xué)計(jì)算和人工智能訓(xùn)練的需求。更令人驚嘆的是研究成果的性能表現(xiàn):在求解32×32矩陣求逆問題時(shí),其算力已超越高端GPU的單核性能;當(dāng)問題規(guī)模擴(kuò)大至128×128矩陣時(shí),計(jì)算吞吐量達(dá)到頂級(jí)數(shù)字處理器的1000倍以上。這意味著傳統(tǒng)GPU需要處理1天的任務(wù),這款模擬計(jì)算芯片僅需1分鐘即可完成。
這種性能飛躍源于模擬計(jì)算的本質(zhì)優(yōu)勢(shì)。當(dāng)前的CPU和GPU均采用馮·諾依曼架構(gòu),將計(jì)算和存儲(chǔ)單元分離,形成了著名的“內(nèi)存墻”問題——數(shù)據(jù)需要在存儲(chǔ)器和處理器間頻繁搬運(yùn),消耗了大量時(shí)間和能量。而基于阻變存儲(chǔ)器的模擬計(jì)算芯片,實(shí)現(xiàn)了真正的“存算一體”,取消了將數(shù)據(jù)轉(zhuǎn)化為二進(jìn)制數(shù)字流的過程,直接利用物理規(guī)律進(jìn)行運(yùn)算,從根本上消除了數(shù)據(jù)搬運(yùn)的能耗。一位芯片工程師向記者介紹說:“阻變存儲(chǔ)最大的特點(diǎn)就是既能存儲(chǔ)又能計(jì)算?,F(xiàn)在,計(jì)算的很大瓶頸在于帶寬,而用阻變存儲(chǔ)結(jié)構(gòu)計(jì)算就不用搬運(yùn)數(shù)據(jù),也就不受帶寬限制了。”
汽車產(chǎn)業(yè)計(jì)算革命新引擎
作為早期計(jì)算機(jī)的核心技術(shù),模擬計(jì)算通過物理定律直接運(yùn)算,具有高并行、低延時(shí)、低功耗的先天優(yōu)勢(shì)。然而,由于傳統(tǒng)模擬計(jì)算精度低、難擴(kuò)展,逐漸被高精度、可編程的數(shù)字計(jì)算取代,成為存于教科書中的“老舊技術(shù)”。尤其隨著人工智能、互聯(lián)網(wǎng)、大數(shù)據(jù)拓展至更多應(yīng)用領(lǐng)域,對(duì)數(shù)據(jù)、算力、算法的需求成倍增長(zhǎng),高性能芯片成為重要的硬件載體。
以往,數(shù)字芯片負(fù)責(zé)思考和計(jì)算,模擬芯片負(fù)責(zé)感知和執(zhí)行。如今,隨著科學(xué)研究的進(jìn)展,這一格局或發(fā)生改變。關(guān)于應(yīng)用前景,孫仲認(rèn)為,模擬計(jì)算在未來AI領(lǐng)域的定位是強(qiáng)大的補(bǔ)充,最有可能快速落地的場(chǎng)景是計(jì)算智能領(lǐng)域,如機(jī)器人和人工智能模型的訓(xùn)練。
在汽車產(chǎn)業(yè)加速邁向電動(dòng)化、智能化的今天,模擬計(jì)算技術(shù)的突破也具有特別意義。隨著自動(dòng)駕駛等級(jí)提升和智能座艙功能豐富,汽車對(duì)算力的需求正呈指數(shù)級(jí)增長(zhǎng)。傳統(tǒng)的數(shù)字芯片雖然能夠提供可靠的算力基礎(chǔ),但功耗和散熱問題逐漸成為制約因素。
樂觀派人士認(rèn)為,模擬計(jì)算芯片的低功耗、高能效特性,恰好契合了電動(dòng)汽車的能效管理需求。當(dāng)解決128×128矩陣求逆問題時(shí),模擬計(jì)算芯片的計(jì)算吞吐量達(dá)到頂級(jí)數(shù)字處理器的1000倍以上,而能耗僅為傳統(tǒng)方案的千分之一。這種能效優(yōu)勢(shì)直接轉(zhuǎn)化為電動(dòng)汽車的續(xù)駛里程提升,也為配裝更復(fù)雜的感知與決策系統(tǒng)提供了可能。
孫仲特別指出,與其他“存算一體”方案相比,他們團(tuán)隊(duì)的特色在于專注于更具挑戰(zhàn)性的矩陣方程求解——這正是AI二階訓(xùn)練的核心。在自動(dòng)駕駛領(lǐng)域,這意味著車輛能夠更快地處理多傳感器融合數(shù)據(jù),實(shí)時(shí)完成復(fù)雜的環(huán)境感知和決策計(jì)算。傳統(tǒng)GPU需要數(shù)小時(shí)完成的訓(xùn)練任務(wù),在新款模擬計(jì)算芯片上可能僅需幾分鐘,有望大幅縮短自動(dòng)駕駛算法的迭代周期。
然而,產(chǎn)業(yè)界的看法更為審慎。一位就職于智能芯片企業(yè)的工程師劉峰(化名)告訴記者:“我研究生階段的課題,就是圍繞阻變存儲(chǔ)器展開的。而該項(xiàng)技術(shù)在我涉足之前的10多年便已啟動(dòng)研究,至今仍未能實(shí)現(xiàn)規(guī)模化落地。因此,我對(duì)這一模擬計(jì)算技術(shù)的應(yīng)用持觀望態(tài)度?!痹谒磥?,除非阻變存儲(chǔ)器能夠在容量上突破TB級(jí)別,否則難以支撐芯片的大規(guī)模實(shí)際應(yīng)用。
另一位汽車芯片企業(yè)負(fù)責(zé)人則從概念層面進(jìn)行了辨析:“研究成果應(yīng)被歸類為模擬計(jì)算芯片,而非廣義上的模擬芯片。我認(rèn)為,就本質(zhì)而言,它更接近數(shù)字芯片的范疇,因其對(duì)標(biāo)的是CPU與GPU這類數(shù)字處理器?!边@位汽車芯片企業(yè)負(fù)責(zé)人表示,這一研究在學(xué)術(shù)界可能受關(guān)注程度不低,但在產(chǎn)業(yè)領(lǐng)域還是一個(gè)新事物。
實(shí)驗(yàn)室到產(chǎn)業(yè)化長(zhǎng)路漫漫
盡管應(yīng)用前景值得期待,但模擬計(jì)算芯片從實(shí)驗(yàn)室走向產(chǎn)業(yè)化,特別是應(yīng)用于要求嚴(yán)格的汽車領(lǐng)域仍面臨多重挑戰(zhàn)。可靠性是首要關(guān)卡,汽車電子需要承受-40℃~125℃的溫度變化、高強(qiáng)度振動(dòng)和電磁干擾,而阻變存儲(chǔ)器件的耐久性和穩(wěn)定性在復(fù)雜車載環(huán)境下尚待驗(yàn)證。劉峰直言:“現(xiàn)在數(shù)字芯片夠用了,而且汽車工況更復(fù)雜,模擬芯片對(duì)電磁的干擾問題并沒解決,其落地的實(shí)用性可能不大?!?
成本與供應(yīng)鏈?zhǔn)橇硪淮筇魬?zhàn)。數(shù)字芯片經(jīng)過數(shù)十年發(fā)展,已形成成熟的規(guī)模化制造和供應(yīng)鏈體系。相比之下,模擬計(jì)算芯片特別是基于新型阻變存儲(chǔ)器的芯片,仍處于實(shí)驗(yàn)室到產(chǎn)業(yè)化過渡的早期階段。劉峰強(qiáng)調(diào):“產(chǎn)品要談規(guī)模,數(shù)字芯片經(jīng)過多年發(fā)展,以規(guī)模平攤了成本,但新型模擬數(shù)字芯片量產(chǎn)還早,恐怕短期內(nèi)成本無法降下來。”這種成本劣勢(shì)在價(jià)格敏感的汽車行業(yè)無疑是一大短板。
技術(shù)成熟度同樣不容樂觀。據(jù)悉,阻變存儲(chǔ)的基礎(chǔ)材料體系仍未完全確定,器件的一致性和可靠性距離車規(guī)級(jí)要求的“零失效”標(biāo)準(zhǔn)還有相當(dāng)距離。正如劉峰透露的:“阻變存儲(chǔ)的材料都還沒確定到底用啥,目前還是在實(shí)驗(yàn)室階段?!边@意味著從材料選擇到制造工藝,整個(gè)技術(shù)鏈條都需要重新建立和完善。
面對(duì)這些挑戰(zhàn),孫仲保持了理性的期待。他強(qiáng)調(diào),模擬計(jì)算在未來AI領(lǐng)域的定位是強(qiáng)大的補(bǔ)充,而非替代?!耙虺墒於扰c經(jīng)濟(jì)性,CPU作為通用‘總指揮’難以被淘汰。GPU則專注于加速矩陣乘法計(jì)算。我們的模擬計(jì)算芯片,旨在更高效地處理AI等領(lǐng)域最耗能的矩陣逆運(yùn)算,是對(duì)現(xiàn)有算力體系的有力補(bǔ)充?!边@種互補(bǔ)共存的思路,或許是最為現(xiàn)實(shí)的發(fā)展路徑。




