寫在前面:12月21日-22日,GTIC 2021全球AI芯片峰會(huì)將在北京舉行。屆時(shí),來自芯片巨頭、獨(dú)角獸公司及創(chuàng)業(yè)新秀的產(chǎn)業(yè)大咖和技術(shù)專家將同臺(tái)分享AI芯片的技術(shù)創(chuàng)新和落地經(jīng)驗(yàn)。大會(huì)前夕,智東西&芯東西對(duì)參會(huì)嘉賓進(jìn)行系列深度對(duì)話,提前一睹他們對(duì)產(chǎn)業(yè)的真知灼見。本期對(duì)話嘉賓為北京大學(xué)信息科學(xué)技術(shù)學(xué)院副院長(zhǎng)兼微納電子學(xué)系系主任蔡一茂教授。
自1956年國家在北京大學(xué)由黃昆先生領(lǐng)銜建立半導(dǎo)體專門化,到北京大學(xué)于2020年設(shè)立集成電路科學(xué)與工程一級(jí)學(xué)科,再到今年7月北京大學(xué)集成電路學(xué)院揭牌成立,北京大學(xué)集成電路學(xué)科已走過65度春秋,正整合優(yōu)勢(shì)產(chǎn)學(xué)資源,邁向新的階段。
作為推動(dòng)北大集成電路學(xué)科建設(shè)的關(guān)鍵成員,北京大學(xué)信息科學(xué)技術(shù)學(xué)院副院長(zhǎng)、微納電子學(xué)系系主任蔡一茂教授長(zhǎng)期從事先進(jìn)存儲(chǔ)器、神經(jīng)形態(tài)器件及類腦芯片關(guān)鍵技術(shù)研究,對(duì)于人工智能時(shí)代新器件、新架構(gòu)、新工藝有著深刻見地。
AI芯片發(fā)展到了怎樣的階段?存算一體因何蓬勃發(fā)展、還需攻克哪些難關(guān)?哪些技術(shù)方向?yàn)锳I加速計(jì)算提供了優(yōu)化能效和性能的更多可能?類腦計(jì)算與AI芯片如何相輔相成?……
圍繞這些問題,近日,智東西與蔡一茂教授展開了一場(chǎng)深度對(duì)話。
從初綻鋒芒到逐漸被大眾認(rèn)知,AI芯片經(jīng)過數(shù)年發(fā)展,已經(jīng)走到了角逐規(guī)模化商用的新節(jié)點(diǎn)。
蔡一茂教授認(rèn)為,從學(xué)術(shù)角度來看,目前AI芯片領(lǐng)域呈百花齊放的態(tài)勢(shì),包括深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)芯片、類腦芯片等很多技術(shù)路徑大家都在探索。
他指出衡量AI芯片方案性能有5個(gè)維度:自適應(yīng)、性能、能效比、可編程性、可擴(kuò)展性。
其中,將可擴(kuò)展性理解成“支撐的參數(shù)規(guī)模更大”還不太夠,將來一個(gè)重要趨勢(shì)是走向通用性,這對(duì)于人工智能、AI芯片都非常重要。
很多AI公司面臨AI芯片或AI方案落地困難或者成本控制的挑戰(zhàn)是無法將一個(gè)方案簡(jiǎn)單的復(fù)制應(yīng)用于不同的場(chǎng)景,而這個(gè)是軟件公司相對(duì)容易做到的。比如微軟Office是一個(gè)標(biāo)準(zhǔn)的通用的產(chǎn)品,只要拿到授權(quán)許可就能使用,因此所有團(tuán)隊(duì)集中起來做好Office,無需設(shè)立專門的團(tuán)隊(duì)來為某家企業(yè)解決Office問題。
但目前大多數(shù)AI公司做不到這一點(diǎn),因?yàn)锳I應(yīng)用場(chǎng)景存在差異化,通常需要根據(jù)其數(shù)據(jù)格式、具體應(yīng)用場(chǎng)景入駐一個(gè)團(tuán)隊(duì)來聯(lián)調(diào)。在蔡一茂教授看來,“這是限制AI算法和芯片實(shí)際大規(guī)模應(yīng)用的一個(gè)重要挑戰(zhàn)”,無論是AI算法還是AI芯片的通用性,產(chǎn)學(xué)界都尚未出現(xiàn)很好的解決方案。
“我相信AI的應(yīng)用會(huì)落地越來越多,雖然現(xiàn)在有些困難,但整體大家還是寄予厚望?!辈桃幻淌谡f,“所以這個(gè)領(lǐng)域的研究在相當(dāng)長(zhǎng)的時(shí)間內(nèi)依然會(huì)是熱點(diǎn)?!?/p>
相比AI芯片發(fā)展初期,如今云端、邊緣市場(chǎng)更為繁榮,更多創(chuàng)企開始主攻大算力芯片。
據(jù)蔡一茂教授觀察,這是整體算力需求使然。隨著AI算力需求大幅飆漲,全國多地開始建設(shè)大規(guī)模AI超算中心。對(duì)于手頭不算寬裕的創(chuàng)企或小型研究團(tuán)隊(duì)來說,這為他們進(jìn)行AI訓(xùn)練、AI推理等運(yùn)算,降低了獲取算力資源的門檻。
目前GPU仍是AI訓(xùn)練市場(chǎng)最主流的加速芯片。盡管一些互聯(lián)網(wǎng)大公司已經(jīng)開始根據(jù)自家業(yè)務(wù)自研芯片來實(shí)現(xiàn)更高的性價(jià)比和對(duì)場(chǎng)景更好的適應(yīng)性,但他們也會(huì)繼續(xù)采用GPU,畢竟GPU更加通用。
有NVIDIA摘冠在前,一些公司已經(jīng)開始布局GPU國產(chǎn)替代方案,將來有望在一些領(lǐng)域或者受限的企業(yè)中,憑借更高性價(jià)比,分得一塊市場(chǎng)。
倘若要對(duì)標(biāo)英偉達(dá)或者相關(guān)的GPU技術(shù),至少在某些領(lǐng)域上能與之匹敵,客戶能夠接受其性價(jià)比,在此過程中逐漸培養(yǎng)起自己的生態(tài)聯(lián)盟。
“如果技術(shù)不行,老拿生態(tài)來講,這是很難行得通的。”蔡一茂教授談道,“技術(shù)上至少要有特色,然后再來看生態(tài)的構(gòu)建;如果技術(shù)還差一大截,就說生態(tài),這是個(gè)偽命題。”
當(dāng)然,技術(shù)的追趕不是一蹴而就,更多的是希望有迭代的機(jī)會(huì),有超越現(xiàn)有技術(shù)的可能。同時(shí),很多人說自己的新技術(shù)有多好,可能過一段時(shí)間,對(duì)手就推出了一個(gè)更厲害的,所以看到競(jìng)爭(zhēng)對(duì)手在進(jìn)步,這也非常重要。
至于其他新興技術(shù)路線,想要取代GPU絕非易事。一方面,許多技術(shù)只能做到單點(diǎn)性能更好,而非綜合性能更好;另一方面,一些已有方案更好落地,投入更多資源就會(huì)迭代得更快。
相比取代GPU,蔡一茂教授相信,發(fā)掘一些新的領(lǐng)域,更可能把市場(chǎng)做的越來越大,比如開發(fā)新興技術(shù)去解決現(xiàn)有GPU不擅長(zhǎng)加速的領(lǐng)域。
▲北京大學(xué)信息科學(xué)技術(shù)學(xué)院副院長(zhǎng)兼微納電子學(xué)系系主任蔡一茂教授
除了AI芯片架構(gòu)本身的進(jìn)展外,更高性能的芯片,往往離不開先進(jìn)的存儲(chǔ)器和封裝方式。
傳統(tǒng)芯片存在的一大瓶頸是“存儲(chǔ)墻”。
存儲(chǔ)和計(jì)算,是芯片的兩大基礎(chǔ)功能。存儲(chǔ)器與計(jì)算單元之間的數(shù)據(jù)搬運(yùn),往往消耗大量功耗,但很多加速芯片并未解決這個(gè)問題。
為了降低數(shù)據(jù)頻繁交換導(dǎo)致的延遲和功耗,以存儲(chǔ)為中心的計(jì)算架構(gòu)逐漸興起,成為AI芯片的一大新興技術(shù)路線。
存儲(chǔ)器可分為易失性存儲(chǔ)器、非易失性存儲(chǔ)器。
(1)易失性存儲(chǔ)器:以SRAM、DRAM為代表,速度快、可靠性較高,但功耗、成本偏高,數(shù)據(jù)在里面只能短暫存儲(chǔ),必須不停地跟外部的非易失性存儲(chǔ)器進(jìn)行交換。
SRAM和DRAM在AI芯片中非常重要。AI芯片如果追求性能,則要求存儲(chǔ)器本身夠快、帶寬夠大,可以快速交換數(shù)據(jù),這離不開SRAM、DRAM的進(jìn)步。
此外,當(dāng)前全球幾家存儲(chǔ)器巨頭都在推進(jìn)基于DRAM技術(shù)的高帶寬內(nèi)存(HBM),現(xiàn)在最先進(jìn)的GPU的性能提升很大一部分也是得益于HBM的進(jìn)步。目前還未見國內(nèi)有公司大規(guī)模量產(chǎn)這種技術(shù)。
(2)非易失性存儲(chǔ)器:目前主流產(chǎn)品是Flash。Flash的優(yōu)勢(shì)尤其體現(xiàn)在邊緣端,一些參數(shù)存放在非易失性存儲(chǔ)器中,后續(xù)有些應(yīng)用可以直接調(diào)用或者直接運(yùn)算。有些公司已利用Flash進(jìn)行AI算法加速或?qū)崿F(xiàn)存內(nèi)計(jì)算功能。
Flash的挑戰(zhàn)在于可靠性不高,可擦寫次數(shù)約10^6次;另外其工作電壓偏高,兼容純邏輯運(yùn)算和工藝的難度較大。目前嵌入式Flash的工藝節(jié)點(diǎn)普遍在40nm,也有些采用28nm,但很難再往更先進(jìn)的節(jié)點(diǎn)推進(jìn)了。臺(tái)積電、三星等都在探索能夠替代Flash的一些新型非易失存儲(chǔ)器,比如阻變存儲(chǔ)器、磁存儲(chǔ)器和鐵電存儲(chǔ)器等。
Flash或者新型存儲(chǔ)器不是拿來就可以用于AI芯片,通常需要針對(duì)性地改工藝、改集成技術(shù),這對(duì)制造端提出了挑戰(zhàn)。
雖然有一些基于SRAM、DRAM、SSD等存儲(chǔ)器的存內(nèi)計(jì)算方案和芯片被提出,但是目前還沒有特別高性價(jià)比的存儲(chǔ)器技術(shù)來支撐存內(nèi)計(jì)算,存內(nèi)計(jì)算也還未真正做到很好的產(chǎn)業(yè)化程度,更多是通過提高存儲(chǔ)器的性能和帶寬,來進(jìn)一步優(yōu)化整個(gè)綜合系統(tǒng)。現(xiàn)階段探索產(chǎn)業(yè)化路線的存內(nèi)計(jì)算以SRAM、DRAM、NOR Flash為主。
除了打造基于先進(jìn)節(jié)點(diǎn)的嵌入式存儲(chǔ)器外,另一技術(shù)方案是先進(jìn)封裝。
像Flash這樣的存儲(chǔ)器不宜用先進(jìn)節(jié)點(diǎn),則可采用更成熟的節(jié)點(diǎn),通過chiplet或者其他先進(jìn)的封裝技術(shù),與擁有先進(jìn)節(jié)點(diǎn)的芯片異構(gòu)封裝在一起,同樣能提升性能。同時(shí),先進(jìn)封裝是實(shí)現(xiàn)高帶寬、高速數(shù)據(jù)交換的重要技術(shù)途徑。
如今在后摩爾時(shí)代,摩爾定律的內(nèi)涵完全變了,不再嚴(yán)格按照最初的定義,而更多是基于集成電路綜合性能的考量,通過異構(gòu)分裝、異質(zhì)封裝、三維器件、新材料等新興技術(shù)的引入,讓集成電路向多維度發(fā)展,實(shí)現(xiàn)等效的摩爾定律的延伸。
從產(chǎn)業(yè)角度來講,做芯片面臨的挑戰(zhàn)主要是性價(jià)比,同一功能的東西,如果性能提高一點(diǎn),但隨之整個(gè)系統(tǒng)或芯片價(jià)格明顯提高時(shí),市場(chǎng)會(huì)很難接受。
蔡一茂教授還提到一個(gè)新趨勢(shì)——感存算一體,這可以被理解為存算一體與傳感、模擬計(jì)算甚至神經(jīng)擬態(tài)的結(jié)合。
我們周圍的物聯(lián)網(wǎng)服務(wù),很多不是0、1編碼直接進(jìn)來,可能是一些傳感器信號(hào)包括視頻信號(hào)、聲音信號(hào)、壓力信號(hào)以及生物信號(hào)等其他參量的信號(hào)。
而且隨著電子設(shè)備對(duì)外圍環(huán)境感知的需求增大和更加精細(xì),通常會(huì)需要多個(gè)傳感器來采集數(shù)據(jù)。
這些信號(hào)如果全部經(jīng)過傳感器往下傳,傳輸編碼過程存在帶寬限制和能耗挑戰(zhàn),通常會(huì)導(dǎo)致性能和能效下降。
但如果在傳感器端就開始對(duì)感知到的信號(hào)做初步處理,這些經(jīng)處理的數(shù)據(jù)再往后傳,對(duì)后面系統(tǒng)的負(fù)擔(dān)就小了很多。
一個(gè)例子是索尼公司的方案,它在CIS芯片開始做感知那一段進(jìn)行運(yùn)算,這通常被稱作“感存算”。擁有龐大數(shù)據(jù)量的自動(dòng)駕駛場(chǎng)景對(duì)感存算一體也有需求,將來激光雷達(dá)或其他傳感器端如果能先對(duì)數(shù)據(jù)做處理,則可以減少后端芯片的壓力。
▲北京大學(xué)集成電路學(xué)院
除了新型存儲(chǔ)器技術(shù)外,蔡一茂教授的團(tuán)隊(duì)也在進(jìn)行類腦芯片關(guān)鍵技術(shù)的研究。
類腦芯片同指受人腦架構(gòu)和信息處理方式啟發(fā),引入生物神經(jīng)計(jì)算方式,有望獲得像人腦般的低功耗和強(qiáng)智能的信息記憶及處理功能,這也是AI芯片的一個(gè)前沿方向。
從學(xué)術(shù)角度講,蔡一茂教授提到國內(nèi)外類腦計(jì)算差距并不大,各有優(yōu)勢(shì)和特色。國內(nèi)科研團(tuán)隊(duì)有多篇文章發(fā)表在Nature等頂級(jí)學(xué)術(shù)期刊上,相關(guān)演示芯片的規(guī)模也足以與國外相匹敵。
在產(chǎn)業(yè)上,類腦芯片在國內(nèi)外尚未出現(xiàn)大規(guī)模商用。就連已被NASA采購的早期類腦芯片代表IBM TrueNorth芯片,迄今也未在民用方面實(shí)現(xiàn)大規(guī)模推廣。目前類腦芯片已有多項(xiàng)應(yīng)用演示,但要真正落到應(yīng)用層,還面臨基本器件、架構(gòu)與算法等多層面的挑戰(zhàn)。
與AI常用的卷積神經(jīng)網(wǎng)絡(luò)(CNN)、深度神經(jīng)網(wǎng)絡(luò)(DNN)不同,類腦計(jì)算采用增加了時(shí)域信息處理的脈沖神經(jīng)網(wǎng)絡(luò)(SNN)或相關(guān)偏生物類的算法,以模擬人腦神經(jīng)突觸通過電脈沖傳遞信息的編碼方式進(jìn)行信息處理。
SNN之于CNN是一個(gè)有益的補(bǔ)充,類腦芯片與傳統(tǒng)深度學(xué)習(xí)AI芯片是齊頭并進(jìn)的關(guān)系,類腦芯片不會(huì)完全取代深度學(xué)習(xí)AI芯片,正如加速AI芯片也不能完全取代CPU和GPU。
將來有些AI任務(wù),比如涉及情感化、超低功耗、非結(jié)構(gòu)數(shù)據(jù)處理等應(yīng)用場(chǎng)景,可能需要人腦的啟發(fā)來進(jìn)行優(yōu)化或者另辟蹊徑。但是要滿足這樣的應(yīng)用需求,不是一個(gè)單點(diǎn)任務(wù)。首先需要處理該任務(wù)時(shí)更具優(yōu)勢(shì)的算法,然后需要專門的類腦芯片來與算法緊密結(jié)合,如果沒有一個(gè)算法來引導(dǎo)芯片怎么工作,則都是空中樓閣。
現(xiàn)在是集成電路發(fā)展的好時(shí)機(jī),蔡一茂希望,學(xué)習(xí)芯片相關(guān)專業(yè)的學(xué)生講一些情懷,愿意在這個(gè)行業(yè)里沉淀下去,能夠?qū)W?、長(zhǎng)期做這件事。
“從事集成電路研究或者生產(chǎn),要樹立服務(wù)國家重大戰(zhàn)略的使命感?!辈桃幻淌谡f,“但是服務(wù)國家重大戰(zhàn)略不是口號(hào),做好自己的本職工作,服務(wù)好自己所在的產(chǎn)業(yè),甚至對(duì)自己的公司做出重要的貢獻(xiàn)或者努力去創(chuàng)新,都是屬于服務(wù)國家重大戰(zhàn)略的具體工作。”
他也很支持學(xué)生創(chuàng)業(yè),但同時(shí)強(qiáng)調(diào)“不要盲目”,不能因?yàn)楝F(xiàn)在芯片投資很熱,就看不上踏踏實(shí)實(shí)在大公司里或者一些現(xiàn)有企業(yè)中做技術(shù)或核心骨干的職位。
創(chuàng)業(yè)是綜合性的,涉及個(gè)人的品性、社會(huì)資源、對(duì)技術(shù)的把握和市場(chǎng)擴(kuò)展的能力,要么自身具有很好的綜合能力,要么能夠組建很好的團(tuán)隊(duì)。自認(rèn)為的技術(shù)先進(jìn)性,也不見得一定會(huì)被市場(chǎng)認(rèn)同,因此勘破市場(chǎng)需求至為關(guān)鍵。
他建議剛畢業(yè)的博士生,可以先到產(chǎn)業(yè)界中去熏陶、去經(jīng)受一些風(fēng)風(fēng)雨雨,知道產(chǎn)業(yè)和市場(chǎng)需要什么,再考慮創(chuàng)業(yè)可能成功率會(huì)大一點(diǎn)。
在交流的尾聲,當(dāng)我們問到芯片領(lǐng)域有關(guān)自主技術(shù)突破的報(bào)道出現(xiàn)的一些誤解,蔡一茂教授特別強(qiáng)調(diào)了兩點(diǎn)。
首先,芯片本身是一個(gè)很寬泛的產(chǎn)品,需要實(shí)現(xiàn)很多技術(shù)方面的突破,不能說一個(gè)點(diǎn)的突破,就說我們完全實(shí)現(xiàn)技術(shù)自主了。
制造端也是如此。例如某一廠商的某個(gè)設(shè)備進(jìn)入5nm節(jié)點(diǎn),就被報(bào)道稱解決了我國5nm制造的“卡脖子”問題,很多民眾對(duì)技術(shù)細(xì)節(jié)并不了解,所以容易受到媒體報(bào)道的影響,希望媒體不要博眼球,對(duì)技術(shù)和實(shí)際情況予以更真實(shí)準(zhǔn)確的報(bào)道。
第二,學(xué)術(shù)成果與產(chǎn)業(yè)問題的解決不要混為一談。學(xué)術(shù)上面向未來的研究進(jìn)展,不見得就能立即用到產(chǎn)業(yè)中,來解決現(xiàn)在的問題。
比如某個(gè)學(xué)術(shù)團(tuán)隊(duì)可能發(fā)表了一篇文章、報(bào)道了一個(gè)學(xué)術(shù)成果,但從學(xué)術(shù)到產(chǎn)業(yè)還有很長(zhǎng)距離,從0到1再從1到100,有時(shí)候相隔甚遠(yuǎn),需要更大的投入、更多評(píng)估以及甚至做好將面臨更大困難乃至最后工程上無法實(shí)現(xiàn)的心里準(zhǔn)備。
中國發(fā)展集成電路的意義重大,也面臨很多挑戰(zhàn),蔡一茂教授認(rèn)為,我們應(yīng)保持信心,也要保持定力,吸引更多人才投入到集成電路研究和產(chǎn)業(yè)中,引進(jìn)高水平的全球人才的同時(shí)也要努力培養(yǎng)出更多優(yōu)秀的本土領(lǐng)軍人才和戰(zhàn)略科技力量。
本文來自微信公眾號(hào)“智東西”(ID:zhidxcom),作者:心緣,36氪經(jīng)授權(quán)發(fā)布。