[汽車之家 新鮮技術(shù)解讀] 自動駕駛系統(tǒng),最關(guān)鍵的部件是什么呢?是傳感器?是控制軟件?還是處理芯片呢?我個人認(rèn)為在目前這個階段來說,處理芯片是一個最關(guān)鍵的部件,它的性能直接影響自動駕駛系統(tǒng)的好壞。過去,頂尖的芯片技術(shù)一直是國外企業(yè)壟斷的,但隨著中國芯片企業(yè)近年的快速追趕,情況已經(jīng)有所改觀。今天我們就來聊聊中國自動駕駛芯片究竟處于一個怎樣的水平?
● 自動駕駛芯片是干什么用的?
雖然目前L3級別有條件自動駕駛車輛在中國尚未落地,但從一些帶有高階L2駕駛輔助系統(tǒng)的車輛上我們可以發(fā)現(xiàn),這些車輛都帶有數(shù)量不少的傳感器用以檢測車輛周圍的障礙物,從而為控制系統(tǒng)決策提供數(shù)據(jù)支持。這些傳感器包括毫米波雷達(dá)、超聲波雷達(dá)、攝像頭等。這些傳感器每秒鐘會產(chǎn)生數(shù)GB(1GB=1024MB=10242KB)的數(shù)據(jù),自動駕駛芯片需要流暢地處理這些數(shù)據(jù)才能保證系統(tǒng)及時作出正確的決策,從而確保車輛的行駛安全。
可能大家對每秒數(shù)GB的數(shù)據(jù)沒有概念,這里舉一個生活中的例子。普通的USB3.0接口U盤,其讀取速度峰值接近200MB/s,要從這個U盤中讀取1GB的文件大約需要5秒左右的時間,足見每秒數(shù)GB的數(shù)據(jù)量是相當(dāng)大的。
自動駕駛系統(tǒng)除了需要解決大流量數(shù)據(jù)傳輸問題,還需要解決的就是如何能快速處理這些海量數(shù)據(jù),而強大的自動駕駛芯片正是那把正確的鑰匙。
● 國外的自動駕駛芯片處在怎樣的水平?
雖然本文主要是講中國自動駕駛芯片的,但知己知彼,百戰(zhàn)百勝,在審視本土狀況之前,我們還是先要來簡單了解國外的情況。國外自動駕駛芯片真正能夠大規(guī)模進(jìn)入量產(chǎn)車市場的無非三家,英偉達(dá)、Mobileye(現(xiàn)已被英特爾收購)、特斯拉。
其中,走實用路線的Mobileye目前市場占有率在70%以上,市場上的產(chǎn)品主要是應(yīng)用于L2駕駛輔助系統(tǒng)的EyeQ3芯片(算力0.256TOPS,“TOPS”是每秒萬億次運算的意思,詳細(xì)介紹請看這篇文章相關(guān)介紹,本文標(biāo)注的算力如無特別說明均指的是8位整數(shù)計算能力)以及具備L3級別自動駕駛能力的EyeQ4芯片(算力2.5TOPS)。像是小鵬G3、蔚來ES6/ES8、廣汽新能源Aion LX就采用了EyeQ4芯片作為其駕駛輔助系統(tǒng)的核心。
相較于英偉達(dá)上代自動駕駛平臺旗艦之作DRIVE PX Pegasus 320TOPS的算力,新的DRIVE AGX Orin平臺的旗艦配置實現(xiàn)了成倍的性能增長。此外,DRIVE AGX Orin平臺的擴(kuò)展柔性化程度相比以往平臺進(jìn)一步提升,能夠通過硬件配置的增減,滿足從一般駕駛輔助到L5級別完全自動駕駛等不同級別車輛的需求。
特斯拉Autopilot 1.0系統(tǒng)采用的是1顆英偉達(dá)Tegra3芯片+1顆Mobileye EyeQ3芯片;Autopilot 2.0系統(tǒng)采用的是1顆英偉達(dá)Tegra Parker芯片+1顆Pascal架構(gòu)GPU芯片;Autopilot 2.5系統(tǒng)采用的是2顆英偉達(dá)Tegra Parker芯片+1顆Pascal架構(gòu)GPU芯片。
已經(jīng)搭載在最新下線特斯拉車型上的自研FSD芯片,單顆芯片算力為72TOPS,F(xiàn)ull Self-Driving Computer集成有兩顆獨立工作的FSD芯片,一顆“掛了”,另外一顆馬上“頂上”,提升了整套系統(tǒng)的安全性和穩(wěn)定性。
當(dāng)然了,除了上面三家鋒芒畢露的企業(yè),還有不少企業(yè)在垂涎自動駕駛芯片這塊蛋糕,其中包括高通、賽靈思、恩智浦等,但這些企業(yè)真正走向量產(chǎn)車的自動駕駛芯片還不成規(guī)模,限于篇幅,這里就不作介紹了。
● 迅速崛起的中國自動駕駛芯片企業(yè)
好了,看完國外的情況,我們目光回到國內(nèi)。自動駕駛芯片市場火爆,國外科技巨頭搶灘登陸,中國企業(yè)究竟實力怎么樣呢?下面我們一起來看看。
◆ 寒武紀(jì)
中科寒武紀(jì)科技股份有限公司(下稱“寒武紀(jì)”)的前身是中國科學(xué)院計算技術(shù)研究所下,由陳云霽和陳天石兩兄弟領(lǐng)導(dǎo)的一個課題組。該課題組在2008年開始研究神經(jīng)網(wǎng)絡(luò)算法和芯片,并在2012年開始陸續(xù)發(fā)表研究成果。
2016年,上述課題組提出的深度學(xué)習(xí)處理器指令集DianNaoYu被ISCA2016所接受,實驗表明搭載該指令集的芯片相較于傳統(tǒng)執(zhí)行X86指令集的芯片,在神經(jīng)網(wǎng)絡(luò)計算方面有兩個數(shù)量級的性能優(yōu)勢。隨著課題組的研究成果趨于成熟,中科寒武紀(jì)科技股份有限公司正式成立,并著手將其芯片和指令集向商業(yè)領(lǐng)域轉(zhuǎn)化。也是在2016年,寒武紀(jì)發(fā)布了首款商用深度學(xué)習(xí)處理器寒武紀(jì)1A。
聊完這家公司的身世,下面我們來看看它的產(chǎn)品。目前寒武紀(jì)有兩款最新的人工智能芯片IP授權(quán),分別是Cambricon-1M和Cambricon-1H。性能指標(biāo)最強的Cambricon-1M-4K在1GHz時鐘頻率下?lián)碛?TOPS的算力;性能指標(biāo)最弱的Cambricon-1H8mini在1GHz時鐘頻率下?lián)碛?.5TOPS的算力。所有型號的詳細(xì)算力參數(shù)可以參看下表。
寒武紀(jì)終端智能處理器IP | |
產(chǎn)品 | 計算能力(1GHz運行頻率時的8位整數(shù)運算能力) |
Cambricon-1M-4K | 8TOPS |
Cambricon-1M-2K | 4TOPS |
Cambricon-1M-1K | 2TOPS |
Cambricon-1H16 | 1TOPS |
Cambricon-1H8 | 1TOPS |
Cambricon-1H8mini | 0.5TOPS |
Cambricon-1M和Cambricon-1H被定義為終端智能處理器IP。我們在手機或者汽車這些終端上出現(xiàn)的人臉識別、指紋識別、障礙物識別、路標(biāo)識別等應(yīng)用都能通過在芯片中集成上述處理器IP實現(xiàn)加速。
上面提到的“邊緣”一詞來自于“邊緣計算”。 邊緣計算是指在靠近智能設(shè)備(終端)或數(shù)據(jù)源頭(云端)的一端,提供網(wǎng)絡(luò)、存儲、計算、應(yīng)用等能力,達(dá)到更快的網(wǎng)絡(luò)服務(wù)響應(yīng),更安全的本地數(shù)據(jù)傳輸。邊緣計算可以滿足系統(tǒng)在實時業(yè)務(wù)、智能應(yīng)用、安全隱私保護(hù)等方面的要求,為用戶提供本地的智能服務(wù)。思元220在邊緣計算中扮演著提高數(shù)據(jù)安全、降低處理延時以及優(yōu)化帶寬利用的角色。
目前寒武紀(jì)高算力芯片產(chǎn)品被定義為智能加速卡,可用于服務(wù)器中加速人工智能運算。谷歌的AlphaGo人工智能機器人打敗韓國世界圍棋冠軍李世石的新聞相信各位有所耳聞,AlphaGo人工智能機器人的背后其實是谷歌自研的TPU芯片。寒武紀(jì)的高算力芯片產(chǎn)品的特性和應(yīng)用也與谷歌TPU類似,當(dāng)然它們之間也可以算是競爭對手了。
所不同的是思元270-S4采用的是被動散熱設(shè)計,最大熱設(shè)計功耗為70W,定位為高能效比人工智能推理設(shè)計的數(shù)據(jù)中心加速卡。這也意味著該卡會有“功耗墻”設(shè)定,即當(dāng)加速卡功耗達(dá)到閾值上限時會降低算力以保證較低的功耗和發(fā)熱。
思元270-F4相當(dāng)于是“滿血版” 思元270-S4,最大熱設(shè)計功耗150W,采用渦輪風(fēng)扇進(jìn)行主動散熱。良好的散熱和充足的供電使得思元270-F4能夠發(fā)揮出思元270芯片的全部性能。該卡定位是為桌面環(huán)境提供數(shù)據(jù)中心級人工智能計算力,簡而言之就是為臺式機配的高性能人工智能加速卡。
雖然思元270在制造工藝上只采用了臺積電的16nm工藝,但整體能耗比還是做得比較不錯的。雖然單卡算力不及最新的英偉達(dá)旗艦計算卡,但5張思元270-S4/思元270-F4并行的話,峰值算力也能達(dá)到英偉達(dá)A100的水平。只是英偉達(dá)A100更先進(jìn)的工藝應(yīng)該在能耗比上面會有一定的優(yōu)勢。
其中思元100-C搭載了視頻和圖像解碼單元,采用被動散熱方式,最大熱設(shè)計功耗為110W;思元100-D不搭載視頻和圖像解碼單元,采用被動散熱方式,最大熱設(shè)計功耗為75W。目前思元100系列產(chǎn)品已經(jīng)于2019年在滴滴云和金山云上得到應(yīng)用。其中滴滴云采用思元100板卡加速彈性推理服務(wù),該服務(wù)用于深度學(xué)習(xí)推理任務(wù);而金山云則采用思元100板卡加速語音、圖像、視頻等人工智能應(yīng)用。
寒武紀(jì)智能加速卡 | |||
產(chǎn)品 | 計算能力(8位整數(shù)運算能力) | 功耗 | 備注 |
思元270-S4 | 128TOPS | 70W | 被動散熱 |
思元270-F4 | 128TOPS | 150W | 主動散熱 |
思元100-C | 32TOPS | 110W | 被動散熱,支持解碼 |
思元100-D | 32TOPS | 75W | 被動散熱,不支持解碼 |
前面講的盡是服務(wù)器級的計算卡,這是不是偏離了我們應(yīng)該聊的自動駕駛芯片話題呢?其實不然。前面也提到了,寒武紀(jì)目前是一家專注于人工智能芯片開發(fā)的企業(yè),自動駕駛領(lǐng)域確實涉足不深,但通過和其他國內(nèi)友商的聯(lián)合還是有一些建樹的。
WiseADCU CN1自動駕駛運算域控制器提供了L3或以上級別自動駕駛系統(tǒng)所需的算力以及傳感器連接數(shù)量需求,實現(xiàn)了仿真、模型、系統(tǒng)、架構(gòu)、編碼、加速、算法七個關(guān)鍵控制點的自主可控。
實際上威盛集團(tuán)由于處理器產(chǎn)品性能競爭力弱,早就退出了主流X86處理器市場的競爭,市場中就剩下英特爾和AMD在角力。兆芯成立后,吃透了威盛的X86技術(shù),并在威盛當(dāng)時最新的處理器架構(gòu)基礎(chǔ)上進(jìn)行全面的改進(jìn)和優(yōu)化,先后推出了ZX-A、ZX-C以及ZX-C+等處理器產(chǎn)品。
6月2日,科創(chuàng)板上市委發(fā)布2020年第33次審議會議結(jié)果公告,寒武紀(jì)上市獲得通過,從受理到審批通過,寒武紀(jì)只用了68天,刷新了科創(chuàng)板審核速度。寒武紀(jì)上市后成為A股中唯一一家人工智能芯片公司,該領(lǐng)域的市場空間在2022年有望超過500億美元,發(fā)展?jié)摿薮。打通了A股融資渠道的寒武紀(jì)究竟能否憑借其獨特的技術(shù)優(yōu)勢進(jìn)一步發(fā)展壯大呢?這誰都說不準(zhǔn),但可以確定的是,寒武紀(jì)的成功上市讓很多投身于該領(lǐng)域的公司贏得了信心,看到了希望,中國人工智能芯片時代或?qū)⒂纱碎_啟。
◆ 地平線機器人
好了,聊完寒武紀(jì),我們來聊聊另外一家人工智能芯片企業(yè)——地平線機器人技術(shù)研發(fā)有限公司(下簡稱“地平線”)。地平線是由前百度深度學(xué)習(xí)研究院常務(wù)副院長余凱于2015年創(chuàng)立的,專注于自動駕駛與人工智能芯片的一家公司。余凱也是百度自動駕駛的發(fā)起人。
余凱建立的地平線,一直以來堅持的是軟件和硬件相結(jié)合的方向。他認(rèn)為,算法、芯片和云計算將構(gòu)成自動駕駛的三個核心支點。相比起前面介紹的寒武紀(jì)注重打造高性能硬件芯片,地平線的商業(yè)模式是把以“算法+芯片”為核心的嵌入式人工智能解決方案,提供給下游廠商。打個比方比較好理解,如果說寒武紀(jì)賣的是處理器芯片,那么地平線賣的就是安裝了操作系統(tǒng)的整機。產(chǎn)品方面,相較寒武紀(jì)從終端到云端的芯片產(chǎn)品布局,地平線雖然自研芯片,但更偏重的是以產(chǎn)品功能來劃分產(chǎn)品線。
硬件上,征程二代芯片內(nèi)部集成了兩個Cortex A53核心、兩個自研的BPU(Brain Processing Unit,可用于加速人工智能算法)核心、DDR4內(nèi)存控制器以及輸入輸出控制器,算力達(dá)到4TOPS,典型功耗為2W,這比起目前主流的Mobileye EyeQ4芯片的算力和能耗比都更優(yōu)秀。
這些智能音箱有較強的自然語義識別功能,能夠識別人們發(fā)出的語音命令,結(jié)合物聯(lián)網(wǎng)技術(shù),人們通過簡單的語音命令除了能夠讓音箱播放在線音頻資源外,還能夠控制各種家電,如開關(guān)、燈泡、風(fēng)扇、空調(diào)等。這就是AIoT的一個最簡單的應(yīng)用例子。
從硬件方面看,旭日二代芯片內(nèi)部集成了兩個ARM Cortex A53核心、兩個自研的BPU核心、DDR4內(nèi)存控制器以及輸入輸出控制器,算力達(dá)到4TOPS,典型功耗為2W。從參數(shù)上看,旭日二代和征程二代好像沒什么差別,實際上征程二代可以看做是旭日二代的車規(guī)版,它滿足AEC-Q100標(biāo)準(zhǔn),在工作溫度、電磁輻射等標(biāo)準(zhǔn)上會更高一些。雖然征程二代和旭日二代均采用臺積電28nm工藝制造,但旭日二代芯片尺寸為14x14mm,比征程二代芯片17x17mm的尺寸更小,更有利于內(nèi)嵌到AIoT設(shè)備當(dāng)中。
地平線機器人人工智能芯片 | |||
產(chǎn)品 | 計算能力(8位整數(shù)運算能力) | 功耗 | 備注 |
征程二代 | 4TOPS | 2W | 車規(guī)級芯片 |
旭日二代 | 4TOPS | 2W | - |
地平線機器人自動駕駛平臺 | |||
產(chǎn)品 | 計算能力(8位整數(shù)運算能力) | 功耗 | 備注 |
Matrix二代 | 16TOPS | - | 基于征程二代芯片 |
Matrix三代 | 192TOPS | 48W | 基于征程三代芯片 |
和寒武紀(jì)一樣,地平線同樣擁有自研的人工智能加速芯片技術(shù)。所不同的是,地平線更注重軟件和硬件的整合,從而為下游廠商提供成熟的解決方案。在資本市場,地平線同樣受到追捧,其投資者眾多,其中包括了世界半導(dǎo)體行業(yè)巨頭英特爾和SK海力士以及國內(nèi)的一線汽車集團(tuán)等。未來地平線是否會和寒武紀(jì)一樣登錄科創(chuàng)板目前還不得而知,但CEO余凱對于在科創(chuàng)板上市是持積極態(tài)度的。我個人是支持有更多像地平線這樣的企業(yè)登錄科創(chuàng)板,更充分的競爭可以避免壟斷同時促進(jìn)該領(lǐng)域的加速發(fā)展。
◆ 西井科技
西井科技創(chuàng)辦于2015年,它起初是一家做類腦芯片的廠商。所謂的類腦芯片簡單來說就是以人腦的工作方式設(shè)計制造出來的芯片。目前大行其道的馮•諾依曼結(jié)構(gòu)處理器芯片,其計算模塊和存儲單元是分離的,芯片工作的過程中需要通過數(shù)據(jù)總線來連接計算模塊和存儲單元,數(shù)據(jù)傳輸上的開銷太大從而限制著這類芯片的工作效率和能耗比的提升。
類腦芯片模仿的是大腦神經(jīng)元的工作形式,大腦的處理單元是神經(jīng)元,內(nèi)存就是突觸。神經(jīng)元和突觸是物理相連的,所以每個神經(jīng)元計算都是本地的,而從全局來看神經(jīng)元們是分布式在工作。類腦芯片由于具有本地計算和分布式工作的特點,所以在工作效率和能耗上相比馮•諾依曼結(jié)構(gòu)處理器芯片更有優(yōu)勢。
雖然這種類腦芯片看著和普通的處理器芯片在外觀上沒有什么不同,但其實內(nèi)部運作原理與傳統(tǒng)的處理器芯片有著本質(zhì)的區(qū)別。國內(nèi)除了西井科技開發(fā)出了類腦芯片,像是清華開發(fā)的天機(TianJic)芯片和浙大開發(fā)的達(dá)爾文(DARWIN)芯片都是類腦芯片。所不同的是,西井科技的DeepSouth芯片是全球首塊可商用5000萬類腦“神經(jīng)元”芯片。
西井科技這艘大船拿著投資人動輒過億的投資款,肯定是要追求盈利的。不管公司的技術(shù)有多超前,無法商業(yè)化在逐利的資本市場必然是無法接受的。隨著人工智能和自動駕駛產(chǎn)業(yè)的興起,西井科技找到了技術(shù)商業(yè)化的契機。
相比起我們前面兩個廠商動輒上百TOPS算力的產(chǎn)品,西井這兩款產(chǎn)品的算力確實有點拿不出手。但西井科技的這兩款芯片能夠?qū)崿F(xiàn)片上學(xué)習(xí),可以隨時新增樣本進(jìn)行增量訓(xùn)練來提升推理準(zhǔn)確率。
西井科技人工智能芯片 | |||
產(chǎn)品 | 計算能力(8位整數(shù)運算能力) | 功耗 | 備注 |
DeepWell | 1.8TOPS(AT 800MHz) | 1W(雙核)/0.5W(單核) | 基于鈉架構(gòu),類腦芯片 |
VastWell | 4TOPS(AT 1GHz) | <2W | 基于鉀架構(gòu),類腦芯片 |
可能大家看到這里還是沒看懂西井科技這兩塊芯片的優(yōu)勢所在,我在這里稍微解析一下大家就能夠明白。目前的自動駕駛算法都是通過高性能服務(wù)器進(jìn)行模型訓(xùn)練(讓計算機去看攝像頭或激光雷達(dá)等傳感器獲取的環(huán)境數(shù)據(jù),學(xué)習(xí)目標(biāo)判斷方法),然后將訓(xùn)練好的模型再部署到車載硬件之中(把機器學(xué)習(xí)到的高效目標(biāo)判斷方法固化到車載自動駕駛系統(tǒng)之中)。
在實際應(yīng)用方面,西井科技并沒有一頭沖進(jìn)乘用車自動駕駛系統(tǒng)領(lǐng)域,而是在智能港口和智能礦場干出了自己的一片天地,并把觸角伸向了智慧醫(yī)療和智慧物流領(lǐng)域。2017年10月,公司與全球知名港機巨頭振華重工建立長期合作伙伴關(guān)系,這是西井科技進(jìn)軍智能港口的重要一步。
自動駕駛卡車要在港區(qū)自動裝卸集裝箱,需要自動駕駛系統(tǒng)精細(xì)的車輛控制、敏銳的環(huán)境識別以及準(zhǔn)確的定位,這些都需要港區(qū)高清地圖配合。西井科技的無人集裝箱卡車定位精度在5cm以內(nèi),這是實現(xiàn)集裝箱自動裝卸的關(guān)鍵。全球首輛港區(qū)作業(yè)無人集裝箱卡車作業(yè)成功,充分展現(xiàn)了西井科技在卡車自動駕駛系統(tǒng)以及高精度地圖繪制領(lǐng)域的實力。
除了自動駕駛和高清地圖繪制外,西井科技還為企業(yè)打包了一整套智能港口和智能礦場解決方案,利用人工智能技術(shù)提升港口和礦場的運作效率,同時能夠進(jìn)一步降低其運營成本。深挖行業(yè)中存在的機遇,逐步筑起行業(yè)壁壘是西井科技面對人工智能芯片市場激烈競爭的重要策略。
作為全球最早落地行業(yè)應(yīng)用的自動駕駛團(tuán)隊,西井科技旗下自動駕駛品牌Qomolo逐路目前涵蓋了無人駕駛跨運車、無人駕駛新能源集卡和無人駕駛礦卡三大項目。
面對乘用車自動駕駛芯片領(lǐng)域的激烈競爭,我認(rèn)為短期內(nèi)西井科技不會進(jìn)入該領(lǐng)域。相反它會通過深耕已有的智能港口、智能礦場以及無人駕駛重卡市場,進(jìn)一步筑高上述市場的壁壘,擴(kuò)大自身的行業(yè)影響力和競爭力。但不能忽視的是,西井科技掌握的類腦芯片技術(shù)或有可能成為未來自動駕駛芯片領(lǐng)域的一個風(fēng)口。
上文詳細(xì)介紹中國3家知名自動駕駛芯片公司及其產(chǎn)品,相信大家應(yīng)該對目前國內(nèi)自動駕駛芯片現(xiàn)狀有了一個更深了解。除了這三家公司,數(shù)字地圖供應(yīng)商四維圖新通過收購杰發(fā)科技也布局自動駕駛芯片市場,但量產(chǎn)芯片目前尚未落地。百度的昆侖芯片以150W的功耗實現(xiàn)了260TOPS的算力,競爭力很強,但其定位為云端全功能人工智能芯片,主要用在服務(wù)器之上。百度在自動駕駛領(lǐng)域的亮點還是在于其Apollo自動駕駛軟件平臺。
● 全文總結(jié):
寒武紀(jì)、地平線、西井科技這三家公司都有著各自的特色和亮點。寒武紀(jì)專注于芯片研發(fā),產(chǎn)品算力最強;地平線除了研發(fā)芯片,還提供完整的自動駕駛軟件方案,對主機廠開發(fā)更友好;西井科技掌握獨特的類腦芯片設(shè)計,在智能港口、智能礦場以及無人駕駛卡車領(lǐng)域已經(jīng)站穩(wěn)了陣腳。整體來看,中國自動駕駛芯片在性能和功耗上和外國芯片相比并不差,如何在中國開放L3級別有條件自動駕駛車輛落地這個時間節(jié)點用產(chǎn)品和服務(wù)先發(fā)制人是中國自動駕駛芯片企業(yè)的制勝關(guān)鍵。究竟鹿死誰手,讓我們拭目以待吧,好戲即將上演!(圖/文/汽車之家 常慶林 部分圖片源于網(wǎng)絡(luò))
好評理由:
差評理由: