中國儲能網(wǎng)訊:近日,北京大學(xué)人工智能研究院孫仲研究員團(tuán)隊聯(lián)合集成電路學(xué)院研究團(tuán)隊,成功研制出基于阻變存儲器的高精度、可擴(kuò)展模擬矩陣計算芯片,首次實(shí)現(xiàn)了在精度上可與數(shù)字計算媲美的模擬計算系統(tǒng),相關(guān)成果10月13日刊發(fā)于《自然·電子學(xué)》期刊。據(jù)報道,該款芯片在求解大規(guī)模MIMO信號檢測等關(guān)鍵科學(xué)問題時,計算吞吐量與能效較當(dāng)前頂級數(shù)字處理器(GPU)提升百倍至千倍。
這樣一則技術(shù)性極強(qiáng)的新聞“刷屏”各大媒體平臺,其“破圈”背后不僅僅是芯片技術(shù)的重大突破,更因?yàn)樗鼡糁辛水?dāng)前數(shù)字算力增長放緩、能耗激增的全球性痛點(diǎn),為AI、自動駕駛等關(guān)鍵領(lǐng)域的算力困境提供了一個全新的解決思路。
從算不準(zhǔn)到精準(zhǔn)計算的復(fù)興
據(jù)了解,數(shù)字計算的統(tǒng)治地位并非與生俱來。在計算機(jī)的早期歲月里,模擬計算曾是絕對主流,它通過連續(xù)的物理量直接表達(dá)和處理信息。然而,隨著計算任務(wù)日益復(fù)雜,模擬計算在精度和擴(kuò)展性上的局限日益凸顯,最終讓位于能夠提供絕對精確結(jié)果的數(shù)字計算。孫仲談到:“如何讓模擬計算兼具高精度與可擴(kuò)展性,從而在現(xiàn)代計算任務(wù)中發(fā)揮先天優(yōu)勢,一直是困擾全球科學(xué)界的‘世紀(jì)難題’?!?
對于大多數(shù)習(xí)慣數(shù)字計算機(jī)(二進(jìn)制)的公眾而言,模擬計算是一個既古老又新奇的概念。孫仲用生動的比喻對其進(jìn)行解釋:“現(xiàn)在的所有芯片都是數(shù)字計算,數(shù)據(jù)需先轉(zhuǎn)換成0和1的符號串。比如,數(shù)字‘十’,需要轉(zhuǎn)譯成‘1’和‘0’,計為‘1010’?!蓖瑯拥?,如果用二進(jìn)制來表示“1+1=2”,則應(yīng)記作“1+1=10”。
模擬計算則無需這層“轉(zhuǎn)譯”,它是一種“類比計算”。一位模擬芯片企業(yè)相關(guān)負(fù)責(zé)人對記者解釋說,傳統(tǒng)模擬芯片的“模擬”,是將自然界的物理常量信號(例如聲、光、熱等),模擬成同樣是常量的電信號(電壓、電流)。也就是說,數(shù)字“十”,可以直接用10伏或10毫伏的電壓來表示。模擬芯片通常處理的都是這種電信號,然后通過模擬數(shù)字轉(zhuǎn)換器(ADC)將之轉(zhuǎn)換為數(shù)字信號,傳輸至CPU/MCU進(jìn)行計算處理。
模擬計算機(jī)在計算機(jī)發(fā)展早期(上世紀(jì)30~60年代)曾被廣泛應(yīng)用,但隨著計算任務(wù)日益復(fù)雜,其精度瓶頸凸顯,逐漸被數(shù)字計算取代。孫仲指出,此次研究的核心正是要解決模擬計算“算不準(zhǔn)”這一痛點(diǎn)。
據(jù)悉,研究團(tuán)隊在試驗(yàn)中成功實(shí)現(xiàn)了16×16矩陣的24比特定點(diǎn)數(shù)精度求逆,矩陣方程求解經(jīng)過10次迭代后,相對誤差可低至10<sup>﹣7</sup>量級。這種精度水平足以滿足絕大多數(shù)科學(xué)計算和人工智能訓(xùn)練的需求。更令人驚嘆的是研究成果的性能表現(xiàn):在求解32×32矩陣求逆問題時,其算力已超越高端GPU的單核性能;當(dāng)問題規(guī)模擴(kuò)大至128×128矩陣時,計算吞吐量達(dá)到頂級數(shù)字處理器的1000倍以上。這意味著傳統(tǒng)GPU需要處理1天的任務(wù),這款模擬計算芯片僅需1分鐘即可完成。
這種性能飛躍源于模擬計算的本質(zhì)優(yōu)勢。當(dāng)前的CPU和GPU均采用馮·諾依曼架構(gòu),將計算和存儲單元分離,形成了著名的“內(nèi)存墻”問題——數(shù)據(jù)需要在存儲器和處理器間頻繁搬運(yùn),消耗了大量時間和能量。而基于阻變存儲器的模擬計算芯片,實(shí)現(xiàn)了真正的“存算一體”,取消了將數(shù)據(jù)轉(zhuǎn)化為二進(jìn)制數(shù)字流的過程,直接利用物理規(guī)律進(jìn)行運(yùn)算,從根本上消除了數(shù)據(jù)搬運(yùn)的能耗。一位芯片工程師向記者介紹說:“阻變存儲最大的特點(diǎn)就是既能存儲又能計算?,F(xiàn)在,計算的很大瓶頸在于帶寬,而用阻變存儲結(jié)構(gòu)計算就不用搬運(yùn)數(shù)據(jù),也就不受帶寬限制了?!?
汽車產(chǎn)業(yè)計算革命新引擎
作為早期計算機(jī)的核心技術(shù),模擬計算通過物理定律直接運(yùn)算,具有高并行、低延時、低功耗的先天優(yōu)勢。然而,由于傳統(tǒng)模擬計算精度低、難擴(kuò)展,逐漸被高精度、可編程的數(shù)字計算取代,成為存于教科書中的“老舊技術(shù)”。尤其隨著人工智能、互聯(lián)網(wǎng)、大數(shù)據(jù)拓展至更多應(yīng)用領(lǐng)域,對數(shù)據(jù)、算力、算法的需求成倍增長,高性能芯片成為重要的硬件載體。
以往,數(shù)字芯片負(fù)責(zé)思考和計算,模擬芯片負(fù)責(zé)感知和執(zhí)行。如今,隨著科學(xué)研究的進(jìn)展,這一格局或發(fā)生改變。關(guān)于應(yīng)用前景,孫仲認(rèn)為,模擬計算在未來AI領(lǐng)域的定位是強(qiáng)大的補(bǔ)充,最有可能快速落地的場景是計算智能領(lǐng)域,如機(jī)器人和人工智能模型的訓(xùn)練。
在汽車產(chǎn)業(yè)加速邁向電動化、智能化的今天,模擬計算技術(shù)的突破也具有特別意義。隨著自動駕駛等級提升和智能座艙功能豐富,汽車對算力的需求正呈指數(shù)級增長。傳統(tǒng)的數(shù)字芯片雖然能夠提供可靠的算力基礎(chǔ),但功耗和散熱問題逐漸成為制約因素。
樂觀派人士認(rèn)為,模擬計算芯片的低功耗、高能效特性,恰好契合了電動汽車的能效管理需求。當(dāng)解決128×128矩陣求逆問題時,模擬計算芯片的計算吞吐量達(dá)到頂級數(shù)字處理器的1000倍以上,而能耗僅為傳統(tǒng)方案的千分之一。這種能效優(yōu)勢直接轉(zhuǎn)化為電動汽車的續(xù)駛里程提升,也為配裝更復(fù)雜的感知與決策系統(tǒng)提供了可能。
孫仲特別指出,與其他“存算一體”方案相比,他們團(tuán)隊的特色在于專注于更具挑戰(zhàn)性的矩陣方程求解——這正是AI二階訓(xùn)練的核心。在自動駕駛領(lǐng)域,這意味著車輛能夠更快地處理多傳感器融合數(shù)據(jù),實(shí)時完成復(fù)雜的環(huán)境感知和決策計算。傳統(tǒng)GPU需要數(shù)小時完成的訓(xùn)練任務(wù),在新款模擬計算芯片上可能僅需幾分鐘,有望大幅縮短自動駕駛算法的迭代周期。
然而,產(chǎn)業(yè)界的看法更為審慎。一位就職于智能芯片企業(yè)的工程師劉峰(化名)告訴記者:“我研究生階段的課題,就是圍繞阻變存儲器展開的。而該項技術(shù)在我涉足之前的10多年便已啟動研究,至今仍未能實(shí)現(xiàn)規(guī)模化落地。因此,我對這一模擬計算技術(shù)的應(yīng)用持觀望態(tài)度?!痹谒磥?,除非阻變存儲器能夠在容量上突破TB級別,否則難以支撐芯片的大規(guī)模實(shí)際應(yīng)用。
另一位汽車芯片企業(yè)負(fù)責(zé)人則從概念層面進(jìn)行了辨析:“研究成果應(yīng)被歸類為模擬計算芯片,而非廣義上的模擬芯片。我認(rèn)為,就本質(zhì)而言,它更接近數(shù)字芯片的范疇,因其對標(biāo)的是CPU與GPU這類數(shù)字處理器?!边@位汽車芯片企業(yè)負(fù)責(zé)人表示,這一研究在學(xué)術(shù)界可能受關(guān)注程度不低,但在產(chǎn)業(yè)領(lǐng)域還是一個新事物。
實(shí)驗(yàn)室到產(chǎn)業(yè)化長路漫漫
盡管應(yīng)用前景值得期待,但模擬計算芯片從實(shí)驗(yàn)室走向產(chǎn)業(yè)化,特別是應(yīng)用于要求嚴(yán)格的汽車領(lǐng)域仍面臨多重挑戰(zhàn)。可靠性是首要關(guān)卡,汽車電子需要承受-40℃~125℃的溫度變化、高強(qiáng)度振動和電磁干擾,而阻變存儲器件的耐久性和穩(wěn)定性在復(fù)雜車載環(huán)境下尚待驗(yàn)證。劉峰直言:“現(xiàn)在數(shù)字芯片夠用了,而且汽車工況更復(fù)雜,模擬芯片對電磁的干擾問題并沒解決,其落地的實(shí)用性可能不大?!?
成本與供應(yīng)鏈?zhǔn)橇硪淮筇魬?zhàn)。數(shù)字芯片經(jīng)過數(shù)十年發(fā)展,已形成成熟的規(guī)?;圃旌凸?yīng)鏈體系。相比之下,模擬計算芯片特別是基于新型阻變存儲器的芯片,仍處于實(shí)驗(yàn)室到產(chǎn)業(yè)化過渡的早期階段。劉峰強(qiáng)調(diào):“產(chǎn)品要談規(guī)模,數(shù)字芯片經(jīng)過多年發(fā)展,以規(guī)模平攤了成本,但新型模擬數(shù)字芯片量產(chǎn)還早,恐怕短期內(nèi)成本無法降下來?!边@種成本劣勢在價格敏感的汽車行業(yè)無疑是一大短板。
技術(shù)成熟度同樣不容樂觀。據(jù)悉,阻變存儲的基礎(chǔ)材料體系仍未完全確定,器件的一致性和可靠性距離車規(guī)級要求的“零失效”標(biāo)準(zhǔn)還有相當(dāng)距離。正如劉峰透露的:“阻變存儲的材料都還沒確定到底用啥,目前還是在實(shí)驗(yàn)室階段?!边@意味著從材料選擇到制造工藝,整個技術(shù)鏈條都需要重新建立和完善。
面對這些挑戰(zhàn),孫仲保持了理性的期待。他強(qiáng)調(diào),模擬計算在未來AI領(lǐng)域的定位是強(qiáng)大的補(bǔ)充,而非替代。“因成熟度與經(jīng)濟(jì)性,CPU作為通用‘總指揮’難以被淘汰。GPU則專注于加速矩陣乘法計算。我們的模擬計算芯片,旨在更高效地處理AI等領(lǐng)域最耗能的矩陣逆運(yùn)算,是對現(xiàn)有算力體系的有力補(bǔ)充?!边@種互補(bǔ)共存的思路,或許是最為現(xiàn)實(shí)的發(fā)展路徑。




