天天看點

輔助駕駛卷進新賽道,行泊一體大有可為?

作者:焉知汽車

最近自動駕駛行業有兩件比較有意思的事,一個是搭載大疆車載靈犀智駕系統的首款量産車 KiWi 正式上市;另一個則是自動駕駛公司 MAXIEYE(智駕科技)的 MAXIPILOT 平台下基于單TDA4的行泊一體系統也要量産了。

為什麼比較有意思呢?

因為這兩套系統有兩個共同的特點,一個是目前的量産版都是兼顧成本效益滿足大衆消費市場的産品;第二個是都叫「行泊一體」輔助駕駛方案。

第一點比較好了解,2022 年智能駕駛行業是兩種現象并行的狀态,以特斯拉、蔚小理、華為為主的自研派,在努力實作高階輔助駕駛的「進城」;大衆價位汽車在加快 L2 級别的方案上車,而這類車型又占據着汽車市場 80% 的比例,是以,L2 到支援高速領航級别的輔助駕駛正在形成規模化。

這就在中低端車型市場産生了一個巨大的需求,而中低端車型對于輔助駕駛有兩個核心關鍵詞:「低成本」、「高可靠」。

在此基礎上進階的高成本效益「行泊一體」方案的到來似乎也給主機廠帶來了一縷春風。

而如何低成本、高效率地擷取車輛大規模上路行駛過程中的高品質、高價值資料,用以疊代技術,開始成為各玩家之間實力比拼的焦點,我們發現MAXIEYE這家公司确實值得多聊聊。

是以,我們梳理了幾個問題,展開聊聊:

  • 什麼是「行泊一體」方案?
  • MAXIEYE在乘用車裡能夠提供什麼獨特的方案?
  • 基于 TDA4 去做行泊一體方案的難點在哪?
  • 方案走向前裝量産,MAXIEYE在技術上有什麼特點?

一、「行泊一體」的戰争已經打響

在講「行泊一體」方案之前,要先來聊聊智能駕駛行業的一些現狀。

輔助駕駛卷進新賽道,行泊一體大有可為?

先看一組資料:

  • 2022年 1 - 6 月,中國進階别輔助駕駛的前裝搭載率是26.64%(L2/2.5 功能具備向上更新的);
  • 2022年 1 - 7 月,中國市場乘用車全品類車型,功能達到基礎L2 的輔助駕駛普及率為 22%;
  • 2022年 1 - 7 月,L2 級智能輔助駕駛标配搭載上險 283.89 萬輛,同比增長接近 70%,同時車型的價格區間平均在 15 - 20 萬之間。

這組資料說明了一個問題: 市場對L2/2.5 級别的輔助駕駛需求更加迫切。

但在智能化的行車部分,除特斯拉、理想、小鵬三家為系統自研,硬體來自第三方供應商外(特斯拉硬體也自研),其餘排在前十的供應商仍為傳統外資 Tier 1,其中,電裝、博世、采埃孚排名前三位。

目前由 Tier 1 提供的主流單目 ADAS 方案中,Mobileye 依托其高性能産品方案主攻中高端市場,博世則以低成本搶占市場,在國内市場表現不錯,但有下降趨勢。

原因在于,Mobileye 和博世雖然都有很強的工程化能力,但Mobileye 在一直是黑盒傳遞的封閉方案,并且不開放視覺感覺算法,車企對産品可以定義的部分很少,是以逐漸被放棄了使用。博世的方案優勢是「标準化」,可以最大節省開發成本,裝載就用;劣勢其實也是「标準化」,智能駕駛系統是一套需要更新的系統,博世很難和衆多客戶一起去疊代系統能力。

這是輔助駕駛第一個痛點: 一套具有「開放性」,且可以「持續疊代」的系統。

而市場的另一個極端則是,以華為、百度、小馬智行等為核心研究 L4 的企業,雖然系統能夠覆寫的場景多,系統的應用更加高階,但正常十幾顆攝像頭、5 顆毫米波雷達、12 顆超音波,外加多顆雷射雷達,再加上一塊數百到數千 TOPS 算力晶片,整個系統的硬體成本最低都要達到 2 - 3 萬元,且最終實作的還是駕駛輔助,并不能完全符合行業的L4标準。

顯然,這對于大衆消費市場來說很難接受,這就有了第二個痛點: 一套極具「成本效益」的系統。

為什麼要說上面這些?

簡單說就是, 在巨大的市場需求下,誰能夠提供一套「低成本」、「性能強」、「高開放性」的系統,誰将有機會吃下更多的市場佔有率。

這和「行泊一體」方案有什麼關系?

我們都知道自動駕駛在技術上,有一個行業共識的目标:用一套系統架構驅動整個車輛的自動化。

是以技術架構上要向基于中央計算的內建化架構更新。但問題在于,這需要一個過程,它需要基礎産業技術的協同進步,比如大模型的神經網絡算法、精度更高的感覺傳感器、大算力計算平台等。而這個逐漸更新技術的過程行業裡有一個叫法——「漸進式」自動駕駛路線。

簡單了解就是, 用現有的技術解決目前的問題,同時快速疊代實作對高階功能的量産。

現在的自動駕駛系統,從技術層去看還是大有不同,這裡面還是多套系統以及多套硬體并行的狀态。

比如,硬體上雖然已經向域控架構內建,但現在多數車企還是擁有 3 - 4 個域控器,而且行車和泊車都需要不同的晶片去驅動;軟體上還是高階領航輔助駕駛一套,高精地圖斷點後降級到 L2 又是一套,同時泊車系統還是一套,而且多數方案還都是不同供應商來做。

結果就是,車輛在功能層實作了統一,同時具備行車、泊車的能力,但 技術架構依然不是最優解,供應商以及主機廠的硬體成本和開發成本依然不低。

怎麼解決呢?

一句話就是: 再內建。

這就說到了「行泊一體」方案,行業第一階段的做法是,不同晶片處理行車和泊車;第二階段的做法是硬體上将行車和泊車的晶片內建到一個控制器,裡面跑兩套算法。

目前普遍處于第二階段,這種形式上的行泊一體并不能真正實作硬體性能的極緻挖掘,對于車廠而言硬體成本也并沒有降低,目前行業中更多的是多晶片拼盤的方案,比如 Eye Q4 + TDA4、J3 + TDA4、雙 TDA4(大疆靈犀智駕) 、 Eye Q4 + S32V(蔚來 866)等。

而第三階段則是,用一顆晶片寫入行車和泊車算法。并在底層軟體、傳感器複用性等次元上不斷更新,實作高成本效益、高內建度的行泊一體解決方案。

行泊一體方案的核心是: 「降低成本」和「簡化技術架構」。

這樣做的方式有幾個優點:

  • 硬體數量減少,降低硬體成本,降低開發成本。
  • 統一适配一個晶片,可以提高系統的運作效率,達到性能優化的目的。
  • 因為簡化了技術架構,涉及到的供應商少了後,可以提高标準化能力。

這就是為什麼,地平線、大疆、智行者等都有行泊一體方案規劃,而且接下來這個領域的競争隻會越來越激烈。

還有一個問題是,兩套算法對于晶片算力的要求會更高,如果需要用一顆 Orin 這樣的大算力晶片其實成本并沒有降低,如果想基于單 J3、S32V、TDA4 去做那就需要在算法上極緻壓榨。

我們了解到 MAXIEYE 的做法是,在嵌入式軟體層面下功夫将算法與晶片的運作效率提高,并且比較快的做到量産狀态。

二、MAXIEYE 憑什麼?

在聊這個技術之前,依舊介紹一下這家公司,MAXIEYE(中文名:智駕科技),是智能駕駛和智慧出行領域的全棧創新及系統方案服務商。

它們的主要産品則是,輔助駕駛(ADAS)和自動駕駛(ADS)系統産品及解決方案,可以覆寫 L0 - L4 技術和服務閉環。

根據 MAXIEYE 的産品規劃可以看到,按系統版本可分為三個:

一,MAXIPILOT 1.0 以及 MAXIPILOT 1.0 PLUS

這套系統采用的是安霸的 CV2系列晶片,感覺硬體上可以從 1R1V - 5R1V 根據車型需求自由裁切,可實作NOM 高速場景領航輔助駕駛。

二,MAXIPILOT 2.0 以及 MAXIPILOT 2.0 PLUS

這個版本 MAXIEYE 就已經對系統進行了內建設計,其中 MAXIPILOT 2.0采用一顆TDA4 就可實作行泊一體,功能上可以達到NOA ,感覺硬體可以做到 5R5V1D,預計量産時間會在 2023 年。

而 MAXIPILOT 2.0 PLUS 基于 50 TOPS級别的晶片,同時會部署 BEV 大模型的算法,可實作AEB/FCW/LDW/LKA/TSR/IHBC/ACC/ICA/TJA /ALC/NOM/AVP等一系列智能駕駛功能和行泊一體方案。

三,MAXIPILOT 3.0

這個版本會基于100+Tops算力平台開發,支援 5R11V3L融合感覺硬體,可以實作含城市領航輔助駕駛的行泊一體方案。

MAXIEYE馬上要量産的基礎版行泊一體将搭載MAXIPILOT 2.0 系統,這套系統的特點是基于一顆 TDA4 VM 而設計。目前,TDA4 晶片有幾個版本(來自TI官方資料):

  • TDA4 VL:算力 4 TOPS
  • TDA4 VM:算力 8 TOPS
  • TDA4 VH:算力 32 TOPS

MAXIEYE 用的是 TDA4 VM 。

行業中也知道,雖然這款晶片的算力已經達到了8 TOPS,但因為 TDA4 晶片原來是給座艙用的晶片,是以即使這款晶片是個成熟的方案,但實際在行車開發應用的過程中,可用的算力會有所受限,就會出現對資料流處理和任務配置設定擁堵的情況。

簡單說就是,會消耗大量算力在一些邊緣化的資料處理任務上,這就會影響系統核心功能的檢測性能,比如對視覺感覺資訊的漏檢。是以雖然衆多的自動駕駛解決方案公司,都基于 TDA4 晶片開發行泊一體方案, 但最終能量産的始終停留在泊車方案,行車上能用好的不多。

輔助駕駛卷進新賽道,行泊一體大有可為?

是以,想用可以,但你必須擁有一套更為獨特的算法能力,這就要說說 MAXIEYE 提到的嵌入式軟體技術,為此我們還專門請教了MAXIEYE 的軟體專家。

三、MAXIEYE 嵌入式軟體解決什麼?

要知道 MAXIEYE 嵌入式軟體解決什麼,就要先知道有什麼問題需要解決。

因為成本,體積,能耗等方面的原因,一般很難把深度學習訓練時候使用的GPU 或者叢集式訓練中心搬到一輛汽車上。是以隻能把這些算法、軟體部署到一些成本、體積、功耗都大幅降低的,帶深度學習推理加速的,嵌入式 SOC 晶片中。

也正因為成本,體積,功耗等原因,也決定了這些嵌入式晶片的算力,記憶體帶寬,記憶體大小等資源方面都非常的有限。尤其是在 1R1V 和 5R5V 之間的一些 L2 或者 L2+ 的輔助駕駛産品上這種資源的緊缺顯得尤為突出。

兩個原因:

  • 深度學習算法工程師在訓練的時候為了達到優秀的效果,一開始是很難顧及到訓練端到部署端這麼大算力懸殊差距的限制。這給嵌入式晶片的深度學習網絡部署工程師保留深度學習網絡的優秀效果提出了很大的挑戰。
  • 輔助駕駛關系到車控,這就要求輔助駕駛産品中的嵌入式軟體具有非常強的穩定性和快速響應能力。

穩定性有兩個方面的表現:一,産品中的 軟體在達到産品宣稱的功能和功能名額的情況下不能當機,哪怕車輛連續開幾天也不能當機;二, 産品的功能名額不能時好時壞,表現要始終如一。

是以, 保留優秀的算法效果,保持産品的高度穩定性和快速的響應,是輔助駕駛産品中嵌入式能力的重要挑戰和展現。

主機廠之是以選擇 TDA4 VM 這顆晶片,

  • TI在車規級晶片供應的傳統供應商裡,有絕對的研發經驗,用起來比較容易上手。
  • 車廠的項目評估周期都比較長,而在早期評估時車規級小算力晶片中帶 GPU 的很少,而環視泊車功能中的圖像拼接、渲染都需要 GPU 效果才能做的比較好,TI 滿足。
  • TDA4 VM 是多核異構的,本身自帶 ISP 和片内實體隔離還能雙核鎖步的MCU,這樣不但可以在系統硬體上減少外置ISP 和一塊車規級 ASIL D MCU 的成本,還可以應對這幾年車規MCU 的保供問題。

TDA4 VM 優點明顯,缺點依然明顯,除了前面提到的實際算力較小以外,還有一些其它方面劣勢,為次我們請教了某新造車品牌的自動駕駛負責人,得到一些資訊。

在深度學習算法部署方面

某車企算法負責人對我說:

TI 其官方提供的深度學習推理加速工具鍊 TIDL 的深度學習算子支援不足,僅支援 20 多種較為基本的算子,就這些基本算子很多使用限制也較大,如 softmax、sigmoid、Inner Product 等,隻支援一維輸入輸出。

另外如 reshape、scale 等算子,不支援在網絡中獨立使用,這些都限制了網絡結構和模型設計。對我們的深度學習算法工程師設計的一些效果很好的私有算子就更加不友好了。

因為我們評估過國内外很多款帶深度學習推理加速的ADAS 嵌入式 晶片。

我們發現 TDA4 VM 在嵌入式端深度學習推理加速的一些主流特性支援做得不是很完善,其沒有對深度學習稀疏化的加速支援,全靠硬算。

而那些對随機或者結構化稀疏支援的比較好的晶片,其推理效率在網絡稀疏化做的比較好的情況下相比硬算能提高好幾倍。

其對批處理、混合精度定點化做的也很不好用,還經常出錯。

軟體 SDK 方面

TDA4 VM 采用的是基于 Open VX 的一套軟體架構,而 Open VX 采用的是一種基于節點的有向無環圖處理方式(DAG)。

這種方式在現在很多輔助駕駛軟體中都有采用,特别是TDA4 VM 這種多核異構,有很多協處理器的大型晶片,每個核上都有自己的作業系統,有的核運作 RTOS,有的核運作 Linux 或者 QNX,有的 MCU 上還運作了 AUTOSAR 系統,Open VX 這種架構本身能夠起到屏蔽硬體操作細節,進而讓軟體工程師更加關注于自己的業務邏輯的目的。

但凡有所能必有所不能,我們發現在TDA4 VM 的 Open VX 實作中很多時候節點與節點之間通信時延開銷比較大,特别是跨核的時候,經常能到 3 - 4 毫秒。

這裡面有個小知識就是,攝像頭的幀率是30 幀每秒,也就是每幀圖像的處理時間也就是33 毫秒,如果在這 33 毫秒時間内圖像的算法沒處理完,下一幀圖像就來了,如此反複很快系統就會當機。

而這 33 毫秒裡面如果被節點之間通信就占去了10%,就太不值得了。

感覺處理鍊條時延較長

輔助駕駛産品中一個攝像頭的深度學習感覺處理由以下幾個環節組成:圖像的 ISP 處理 > 畸變矯正處理 > 裁剪縮放拼接處理 > 深度學習網絡輸入 padding 處理 > 深度學習網絡推理 > 深度學習網絡後處理 > 感覺目标跟蹤處理 > 多傳感器感覺目标融合 > 規劃控制車輛運作。

TDA4 VM 多核異構,感覺圖像的 ISP,畸變矯正,裁剪縮放等前處理都有專門的硬體協處理器,但面對衆多深度學習網絡的不同需求,各個協處理器的能力還是顯的捉襟見肘,導緻每一步處理時延都較長。

也就是,TDA4 VM 各個協處理器有限的處理能力導緻感覺處理鍊條時延較長,這些都對單 TDA4 行泊一體産品提出巨大挑戰,當我們将這些問題丢給MAXIEYE 軟體總監鄭朝輝時,他回答的很實在,讓我頗有些意外。

鄭朝輝表示, 這些問題确實存在,而且這不是提出一兩個方法能夠帶來結果的,而是要有一套系統的方法論,就是用“實事求是”的态度去挖掘這些問題根本原因,就像華羅庚所說“善于退,足夠地退,退到最原始而不失去重要性的地方”,然後再用“創新”去解決問題。

MAXIEYE 的做法是, 在軟體架構上面,對于 部分重要跨核通信,他們放棄了TDA4 VM設定的 Open VX 基于節點的通信方式。

他們在應用層之下的系統中間層找到了一種跨核通信硬體機制,然後自己寫了一套 C/S 通信方式,這種處理方式能讓多個深度學習網絡的處理和其後處理高度并行,大大提高效率并降低感覺目标的處理時延。

重要的是他們還自研了 SOA 架構中間件。

這上面一段話可能比較難了解,簡單解釋一下:

在自動駕駛系統這整個方案裡,軟硬體之間的關系是,晶片廠商提供硬體以及跑在硬體上的基礎核心,而自動駕駛系統通常是最高一層應用層,但在應用層和核心層之間,其實還有一座橋那就是中間件,有了中間件也就保證了這塊晶片是一塊誰都可以用的通用晶片了,主機廠或方案公司隻需要做應用層的開發就好。

而中間件除了是一座橋,連接配接軟硬體,它還是資料排程和算力配置設定以及跨核通信的中樞,而整個傳感器過來的資料要經過中間件這層,如果用第三方中間件,資料排程可能不那麼高效準确。

MAXIEYE 的優勢在于,他們研發了底層作業系統級别,可以實時對自己的資料進行排程和分流,結果則是,不僅可以有效利用算力,還可以進行針對性訓練。

四、寫在最後

從市場角度來看,「行泊一體方案」真正的競争其實才剛開始,大疆已經率先量産,MAXIEYE 緊跟其後,是以都具有一定的先發優勢。差別在于,MAXIEYE 是基于單 TDA4 VM 上線了 L2++ 的能力,大疆依然是雙 TDA4 VM。

在這個級别的方案上,非常考驗廠商對于成本的控制和性能的保持。

是以,誰能控制成本給出一套滿足功能需求的系統,并且具有量産的先發能力,誰将有可能領跑對手,MAXIEYE 和大疆有這潛力。

作者 | 德鹵

出品 |焉知

繼續閱讀