[汽車之家 新鮮技術(shù)解讀] 華為成立于1987年,是一家制造通訊設(shè)備起家的中國企業(yè)。經(jīng)過30多年的積累,華為已經(jīng)發(fā)展成為全球最大的5G設(shè)備供應(yīng)商。隨著人工智能芯片市場(chǎng)的快速增長,華為借助中科寒武紀(jì)的芯片IP,成功在2017年推出了全球首款搭載人工智能加速單元的手機(jī)處理器芯片——麒麟970。該芯片的成功讓華為進(jìn)一步堅(jiān)信人工智能技術(shù)的發(fā)展?jié)摿,加速了其自研人工智能處理器的步伐。而自?dòng)駕駛系統(tǒng)的域控制器正是人工智能芯片大派用場(chǎng)的地方。究竟華為的人工智能芯片性能有多強(qiáng)?它又是如何賦能自動(dòng)駕駛汽車的呢?今天我們一起來看一看。
● 先聊聊大家熟悉的手機(jī)處理器NPU
華為的自研人工智能芯片最開始是應(yīng)用在手機(jī)芯片上的,后來才被應(yīng)用到服務(wù)器和汽車自動(dòng)駕駛系統(tǒng)等領(lǐng)域。下面我們就先來聊聊大家熟悉的搭載人工智能加速單元的手機(jī)處理器。華為的人工智能加速單元稱為“NPU”,英文全稱為“Neural-network Processing Units”,翻譯過來就是神經(jīng)網(wǎng)絡(luò)處理單元。該NPU在手機(jī)上能夠?qū)θ四樧R(shí)別、語音識(shí)別、圖像識(shí)別等功能實(shí)現(xiàn)加速,從而為手機(jī)用戶提供更優(yōu)秀的使用體驗(yàn)。
在《和國外差距有多大?聊中國自動(dòng)駕駛芯片》中我提到了,麒麟970處理器搭載的NPU實(shí)際上是來自于中科寒武紀(jì)的Cambricon-1A處理器IP,該芯片搭載在華為Mate 10手機(jī)之上。
華為隨后發(fā)布的麒麟980(搭載在華為Mate 20手機(jī)上)處理器的NPU采用的是中科寒武紀(jì)Cambricon-1H處理器IP。
從目前網(wǎng)上公布的參數(shù)來看,麒麟810的NPU算力為0.83TFLOPS(注:1TFLOPS=每秒一萬億次的浮點(diǎn)運(yùn)算),麒麟820的NPU算力為1.33TFLOPS。廠家并沒有公布麒麟990和麒麟985的具體算力數(shù)值,但從蘇黎世理工的AI Benchmark網(wǎng)站的數(shù)據(jù)來看,麒麟990的NPU算力在麒麟820之上,根據(jù)測(cè)試數(shù)據(jù)估計(jì)其算力在2TFLOPS以上。而麒麟985的NPU算力會(huì)稍高于麒麟820。
麒麟710A是2018年推出的麒麟710的車規(guī)級(jí)版本,該芯片有完全的自主知識(shí)產(chǎn)權(quán)并將由中芯國際代工,是一顆純正的“中國芯”。華為麒麟710進(jìn)入汽車圈并成功落地后將會(huì)和高通驍龍820A搶占市場(chǎng)份額。
隨著這些搭載驍龍820A的新車陸續(xù)上市,它們帶起了一波高科技座艙潮流。華為麒麟710A此時(shí)入市,正好是趕上了這波風(fēng)潮,相信未來有不少中國品牌企業(yè)會(huì)考慮采用華為的這顆帶有純正中國血統(tǒng)的數(shù)字座艙芯片。
雖然說麒麟710A的性能和華為最新推出的麒麟芯片性能有一定的差距,而且沒有集成NPU核心,但滿足數(shù)字座艙多屏顯示和交互的性能需求是完全沒有問題的。華為通過數(shù)字座艙進(jìn)入汽車領(lǐng)域只是試水,進(jìn)一步布局自動(dòng)駕駛汽車芯片領(lǐng)域才是關(guān)鍵。
● 華為自動(dòng)駕駛網(wǎng)絡(luò)架構(gòu)
華為創(chuàng)始人兼總裁任正非在接受媒體對(duì)話時(shí)曾表示華為不會(huì)制造整車,但華為會(huì)造車聯(lián)網(wǎng)模塊、汽車中的電子部分,而且還可能做全世界最好的。既然如此,那華為定必會(huì)搶占車聯(lián)網(wǎng)和自動(dòng)駕駛這兩個(gè)領(lǐng)域的主導(dǎo)權(quán)。
如果華為的ADN目標(biāo)架構(gòu)成為了行業(yè)標(biāo)準(zhǔn),這將成為華為未來10年的一個(gè)極為重要的利潤增長點(diǎn)。華為的目標(biāo)是非常宏大的,那就是包攬高階自動(dòng)駕駛系統(tǒng)的各種通訊和計(jì)算設(shè)備,并提供完善的一站式解決方案。通俗來講就是要達(dá)到“要買自動(dòng)駕駛汽車的通訊和計(jì)算設(shè)備,找華為就對(duì)了”的效果。
本文雖然聚焦于芯片,但華為的強(qiáng)大不僅僅在于芯片,其在老本行網(wǎng)絡(luò)通訊方面也同樣出類拔萃。在聊芯片前,我想先舉個(gè)車路協(xié)同的簡單例子來說明這一點(diǎn)。
這個(gè)簡單的例子能夠很好地說明華為是如何通過網(wǎng)絡(luò)和通訊技術(shù)來賦能自動(dòng)駕駛的?梢哉f未來的自動(dòng)駕駛汽車絕不是一個(gè)“孤島”,而是一個(gè)與萬物互聯(lián)的移動(dòng)工具。
● 華為自動(dòng)駕駛“芯”實(shí)力和軟實(shí)力
好了,簡單聊了一下華為的網(wǎng)絡(luò)架構(gòu)在車路協(xié)同上的應(yīng)用,下面我們來正式聊一下華為的自動(dòng)駕駛平臺(tái)和芯片。由于自動(dòng)駕駛平臺(tái)是基于華為的人工智能芯片搭建的,所以我們還是得先來簡單了解下華為的人工智能芯片。
昇騰910的應(yīng)用偏向于需要極高算力的云端設(shè)備,而昇騰310的應(yīng)用則偏向于對(duì)能耗比有一定要求的終端設(shè)備,但兩者會(huì)有一定的交集。下表我匯總了目前華為應(yīng)用上述兩款芯片打造出來的Atlas系列產(chǎn)品的信息。
華為Atlas系列產(chǎn)品 | |||
產(chǎn)品 | 計(jì)算能力 | 功耗 | 備注 |
Atlas 900 AI集群(型號(hào)9000) | 256-1024 PFLOPS | - | AI集群服務(wù)器 |
Atlas 800 訓(xùn)練服務(wù)器(型號(hào)9010) | 2 PFLOPS | 5.5kW功耗,風(fēng)冷主動(dòng)散熱 | AI訓(xùn)練服務(wù)器 |
Atlas 800 訓(xùn)練服務(wù)器(型號(hào)9000) | 2 PFLOPS | 5.5kW功耗,風(fēng)冷主動(dòng)散熱 | AI訓(xùn)練服務(wù)器 |
Atlas 800 訓(xùn)練服務(wù)器(型號(hào)3010) | 448 TOPS | - | AI推理服務(wù)器 |
Atlas 800 訓(xùn)練服務(wù)器(型號(hào)3000) | 512 TOPS | - | AI推理服務(wù)器 |
Atlas 500 Pro 智能邊緣服務(wù)器 (型號(hào):3000) | 256 TOPS | - | AI邊緣服務(wù)器 |
Atlas 500 智能小站(型號(hào):3000) | 16 TOPS | 有盤40W,無盤25W | AI邊緣服務(wù)器 |
Atlas 300T 中心訓(xùn)練卡(型號(hào):9000) | 256 TFLOPS | - | AI加速卡 |
Atlas 300 推理卡(型號(hào):3000) | 64 TOPS | 最大67W | AI加速卡 |
Atlas 200 DK 開發(fā)者套件(型號(hào):3000) | 8-16 TOPS | 典型功耗20W | AI應(yīng)用開發(fā)板 |
Atlas 200 AI加速模塊(型號(hào):3000) | 8-16 TOPS | 典型功耗20W | AI加速模塊 |
注:這里的1TOPS=每秒1萬億次8位整數(shù)運(yùn)算,1TFLOPS=每秒1萬億次16位浮點(diǎn)數(shù)運(yùn)算,1PFLOPS=每秒1千萬億次16位浮點(diǎn)數(shù)運(yùn)算。 |
人工智能加速芯片要真正運(yùn)行起來還需要CPU的配合。上面提到的Atlas系列產(chǎn)品中,有一部分搭載了英特爾的服務(wù)器級(jí)CPU,另一部分則搭載的是華為自家的鯤鵬920 CPU芯片。
這與大部分其他芯片廠商只做B2B業(yè)務(wù),簽了合約才提供開發(fā)文檔的做法有很大的不同。不管開發(fā)者能力的高低,更多開發(fā)者采用華為的設(shè)備開發(fā)有利于更快地構(gòu)建起屬于華為的人工智能生態(tài)鏈,這將加速華為在人工智能領(lǐng)域的發(fā)展步伐。
當(dāng)然,針對(duì)不同的細(xì)分領(lǐng)域,華為還會(huì)提供針對(duì)性的軟件服務(wù),限于篇幅這里就不詳細(xì)展開了,感興趣的朋友可以去華為云逛一下了解更多。在其他芯片企業(yè)還在苦苦尋找行業(yè)突破口的時(shí)候,華為已經(jīng)為各種不同行業(yè)提供了全面而完整的解決方案?粗倬W(wǎng)密密麻麻各種行業(yè)的解決方案列表,我深感華為的強(qiáng)大;蛟S也正是華為的強(qiáng)大,才是其它企業(yè)苦苦追尋的重要原因。
● 搭載昇騰310的MDC自動(dòng)駕駛平臺(tái)
好了,聊完芯片,我們來聊聊華為的自動(dòng)駕駛平臺(tái)。華為目前最新的自動(dòng)駕駛平臺(tái)旗艦產(chǎn)品是MDC600,能夠滿足L4級(jí)別自動(dòng)駕駛對(duì)域控制器的性能需求;而針對(duì)L3級(jí)別有條件自動(dòng)駕駛,華為推出了MDC300。
昇騰310單芯片算力為16TOPS,功耗為8W,能耗比為2TOPS/W;特斯拉Autopilot 3.0處理單元上的FSD芯片單芯片算力為72TOPS,功耗約為36W,能耗比為2TOPS/W;英偉達(dá)最新DRIVE AGX Orin平臺(tái),其上搭載的Orin芯片,單芯片算力達(dá)到200TOPS,功耗為45W,功耗算力比為4.4TOPS/W。相比起來,昇騰310的能耗比已趕上國際主流水平。目前昇騰310采用的是臺(tái)積電12nm工藝制造,隨著未來生產(chǎn)工藝提升至7nm甚至5nm,其能耗比還有進(jìn)一步提升的空間。
MDC自動(dòng)駕駛硬件平臺(tái)、車載操作系統(tǒng)鴻蒙內(nèi)核目前都已經(jīng)先后獲得ISO26262道路車輛功能安全國際標(biāo)準(zhǔn)中的 ASIL-D等級(jí)(下面簡稱“ISO26262 ASIL-D等級(jí)”),后續(xù)華為的Adaptive AUTOSAR架構(gòu)、開發(fā)工具鏈以及自動(dòng)駕駛算法如果也能通過ISO26262 ASIL-D等級(jí)的話,那么華為的 MDC自動(dòng)駕駛系統(tǒng)將成為全球首個(gè)符合ISO26262 ASIL-D等級(jí)的商用自動(dòng)駕駛系統(tǒng)。
符合ISO26262 ASIL-D等級(jí)意味著什么呢?這意味著車輛上的MDC自動(dòng)駕駛系統(tǒng),每1億小時(shí)才會(huì)有1次隨機(jī)硬件失效,安全系數(shù)是相當(dāng)高的,普通用戶使用MDC自動(dòng)駕駛系統(tǒng)時(shí)遇到隨機(jī)硬件失效的概率極低。
MDC自動(dòng)駕駛平臺(tái)的系統(tǒng)架構(gòu)是可伸縮的,通過對(duì)CPU內(nèi)核數(shù),人工智能加速內(nèi)核搭載數(shù)量以及IO接口數(shù)量的增減,可滿足高、中、低端乘用車從駕駛輔助到高端智能駕駛的不同使用場(chǎng)景。
時(shí)至今日,華為的MDC自動(dòng)駕駛平臺(tái)已經(jīng)簽下了超過18家客戶,其中上汽、吉利、江淮、一汽紅旗、東風(fēng)汽車、蘇州金龍、新石器、山東浩睿智能等企業(yè)都榜上有名。
從云端到終端,華為有一整套完備的自動(dòng)駕駛解決方案,那么是否就能說華為就所向披靡了呢?非也!華為在自動(dòng)駕駛領(lǐng)域所欠缺的是實(shí)際路況的海量大數(shù)據(jù),沒有這些數(shù)據(jù)來訓(xùn)練自動(dòng)駕駛系統(tǒng),系統(tǒng)也只能停留在實(shí)驗(yàn)室和封閉試駕場(chǎng)里。為此,華為也積極與相關(guān)企業(yè)進(jìn)行合作,如擁有地圖資源的四維圖新以及多家中國整車企業(yè),來補(bǔ)足自身在路況大數(shù)據(jù)方面的不足,進(jìn)一步筑高自身在自動(dòng)駕駛領(lǐng)域的技術(shù)壁壘。
● 編輯總結(jié):
華為在行業(yè)中的影響力毋容置疑,從技術(shù)到產(chǎn)品都走在世界的前列。樹大招風(fēng),華為近年來就一直受到美國的制裁。如果現(xiàn)狀長期持續(xù)的話,對(duì)于本文聚焦的華為人工智能芯片影響不小。如何解困是擺在華為面前的一道難題,從目前的一些信息來看,華為在英國建設(shè)芯片工廠、開發(fā)RISC-V架構(gòu)處理器、培育HMS云服務(wù)生態(tài)等舉措都是其突圍關(guān)鍵,我們也將持續(xù)關(guān)注事態(tài)的進(jìn)一步發(fā)展情況。(圖/文/汽車之家 常慶林)
好評(píng)理由:
差評(píng)理由: