[汽車之家 行業(yè)] 在2021年CES上,L4級自動駕駛解決方案提供商元戎啟行將在線上展示其針對L4級自動駕駛深度學(xué)習(xí)模型研發(fā)的推理引擎DeepRoute-Engine。該推理引擎實現(xiàn)了比開源深度學(xué)習(xí)框架平均高6倍的推理速度。大幅提升了自動駕駛的計算效率,有利于自動駕駛擺脫對高算力計算平臺的依賴。
元戎啟行是一家L4級自動駕駛解決方案提供商,為車企、Tier1、出行公司、物流企業(yè)等提供多應(yīng)用場景、定制化的自動駕駛解決方案。其在深圳、北京均設(shè)有研發(fā)中心,公司的研發(fā)人員覆蓋感知、高精度地圖及定位、規(guī)劃與控制、硬件系統(tǒng)、基礎(chǔ)架構(gòu)、模擬系統(tǒng)、數(shù)據(jù)平臺等自動駕駛?cè)邪l(fā)鏈。
自動駕駛要做到像人類一樣感知周圍物體,需要通過深度學(xué)習(xí)來完成,即需要通過大規(guī)模的、復(fù)雜的深度學(xué)習(xí)網(wǎng)絡(luò)模型來對輸入的數(shù)據(jù)進行推理。在推理過程中,需要實時完成大量的計算。因此,自動駕駛企業(yè)對計算平臺的算力有著嚴格的要求。這類計算平臺不僅成本高達數(shù)萬元,功耗也高達數(shù)百瓦。假設(shè)計算平臺的平均功率為500W,其24小時的耗電量約占一輛蓄電量為50kW·h的電動車的24%。
為了擺脫自動駕駛對這類計算平臺的依賴,降低自動駕駛的硬件成本,以及減少自動駕駛硬件耗能對汽車行駛里程的影響,元戎啟行選擇了另一種方式。通過自研的推理引擎——DeepRoute-Engine,讓L4級自動駕駛的感知模塊,可以運行在低成本、低功耗的計算平臺上。
『元戎啟行與曹操出行合作的自動駕駛車型幾何A(參數(shù)|詢價)』
根據(jù)元戎啟行與曹操出行合作的自動駕駛車型——幾何A的實車測試,元戎啟行的自動駕駛系統(tǒng),每行駛100公里只消耗1度電。該耗電量還包括了車內(nèi)負載2人,空調(diào)開啟,以及傳感器風(fēng)阻對能量的耗費。
在自動駕駛系統(tǒng)中,感知模塊是其最核心、計算量最大的軟件模塊。想要提高感知模塊的運行效率,就需要針對感知算法的特點、計算需求,以及計算平臺的架構(gòu)特點進行適配,從而驅(qū)動系統(tǒng)的高效運行。一個定制的推理引擎就相當于定制的驅(qū)動器,不僅能夠提高感知模塊運行效率,還能提高系統(tǒng)可擴展性,兼容更多計算平臺。
L4級自動駕駛感知算法所使用的深度學(xué)習(xí)框架非常復(fù)雜,需要實時進行大量復(fù)雜計算。目前市場上開源的推理引擎,大多無法處理復(fù)雜的L4級自動駕駛深度學(xué)習(xí)模型。對此,元戎啟行的推理引擎通過智能的算子融合,將推理過程中可合并的運算進行合并,大幅提高計算效率。
DeepRoute-Engine還針對不同品牌的計算平臺設(shè)計了定制的內(nèi)核程序,用以執(zhí)行所需的大量并行計算。DeepRoute-Engine目前支持包括AMD、Nvidia、Intel等品牌的GPU,以及華為的車載計算平臺。
目前,市場上常見的用于自動駕駛的計算平臺有CPU、以及采用GPU、FPGA、ASIC等架構(gòu)的AI芯片。由于自動駕駛系統(tǒng)需要處理激光雷達、相機等傳感器采集的海量數(shù)據(jù),傳統(tǒng)的CPU算力越來越無法滿足使用要求,以GPU架構(gòu)為主的AI芯片成為了實現(xiàn)自動駕駛必不可少的硬件。
編輯點評:
自動駕駛系統(tǒng)中的復(fù)雜計算,一方面依靠硬件算力,另一方面是計算效率,前者需要投入大量資金,后者則離不開底層技術(shù)的鉆研和開發(fā)。而根據(jù)預(yù)測,中國未來很可能成為全球最大的自動駕駛市場,至2030年,自動駕駛相關(guān)的新車銷售及出行服務(wù)創(chuàng)收將超過5000億美元。2021年的CES上,還會帶來哪些智能出行領(lǐng)域的新鮮產(chǎn)品和技術(shù)呢?讓我們一同期待吧!(文/汽車之家 翁萌)
好評理由:
差評理由: