来源:国信证券。
一、特斯拉(TESLA):
从硬到软的全栈自研,打造“算力+算法+数据”的竞争壁垒
1、从Mobileye到英伟达,最终走向FSD自研芯片。
特斯拉于2014年推出自动驾驶辅助系统Autopilot 1.0,特斯拉掌握核心数据、AI算法以及主控芯片,从硬到软的全栈自研,这也成为了特斯拉最核心的竞争壁垒。特斯拉成立于2003年,并于2010年在纳斯达克上市。2008年至2020年特斯拉共发布Model S、Model X、Model 3、Model Y四款量产车型。特斯拉于2013年开始自动驾驶辅助系统的研发,并于2014年特斯拉推出自动驾驶辅助系统Autopilot 1.0,此后经历四次升级,并在2019年在HW 3.0平台上推出了自研的FSD主控芯片。
特斯拉从Mobileye到英伟达,最终走向FSD自研芯片。特斯拉从2014年推出HW 1.0开始,特斯拉Autopilot系统共经历了4次大的硬件版本更新。在2014年-2016年的HW 1.0时代,特斯拉完全基于1颗Mobileye EyeQ3和1颗NVIDIA Tegra 3,算法也完全由第三方供应商Mobileye提供,2016年特斯拉逐渐不满于Mobileye进程缓慢以及相关安全事故,并在2016年的HW 2.0版本上,特斯拉切换到了由1颗NVIDIA Parker SoC和1颗NVIDIA Pascal GPU组成的NVIDIA DRIVE PX 2计算平台,而在2017年的HW 2.5版本升级过程中,将NVIDIA Drive PX 2升级为NVIDIA Drive PX 2+,新增了一个NVIDIA Parker SoC,获得了80%左右的运算性能提升。
特斯拉即将发布HW 4.0平台,基于三星7nm工艺的FSD自研芯片,其性能将是HW 3.0的三倍。由于英伟达的高能耗,2017年起,马斯克决定开始自研主控芯片,尤其是主控芯片中的神经网络算法和AI处理单元全部由特斯拉自主完成。在2019年4月份,特斯拉在Autopilot HW 3.0平台上成功推出自研的FSD主控芯片,实现了自动驾驶芯片+神经网络算法的垂直整合。特斯拉计划将在不久的未来HW 4.0版本,基于三星7nm工艺的全新FSD自研芯片,其性能将是HW 3.0的三倍。
特斯拉FSD芯片是以NPU(ASIC)为计算核心,采用“CPU+GPU+ASIC”的技术路线,FSD主要有三个模块CPU、GPU和NPU。特斯拉于2019年推出自研的FSD芯片,并在其Model S、Model X、Model 3上批量交付FSD芯片。该芯片采用三星14nm FinFET工艺制造,面积为260平方毫米,封装了大约60亿个晶体管。(1)CPU:Cortex-A72架构,共三组、每组4个核,一共有12核、最高运行频率2.2GHz,CPU主要处理通用的计算和任务;(2)GPU:最高工作频率为1 GHz的GPU,最高计算能力为600 GFLPS;(3)NPU:2个Neural Processing Unit(NPU),每个NPU可以执行8位整数计算,运行频率为2GHz,单个NPU算力36.86 TOPS,2个NPU的总算力为73.73 TOPS。从面积来看,NPU面积占比最大,NPU主要用于运行深度神经网络,GPU主要用于运行深度神经网络的post processing,处理深度神经网络的部分合计占据了芯片70%的面积。
特斯拉HW 3.0采用完整的双系统冗余。特斯拉HW 3.0采用完整的双系统冗余,在任何一个功能区域发生损坏时,整个系统依旧可以正常工作,确保车辆能安全行驶。HW 3.0的性能比上一代HW 2.5提高了21倍,而功耗降低25%,能效比2 TOPS/W。
2、伴随自动驾驶功能不断升级,FSD软件收费价格持续攀升。
特斯拉FSD开通价格不断攀升,海外已涨价至1.2万美元。特斯拉FSD具有一次性支付和订阅两种购买方式。2022年1月,特斯拉FSD再次涨价至1.2万美元。在国内市场,特斯拉FSD只涨过一次价格,从5.6万涨到6.4万元。在订阅服务方面,2021年7月特斯拉推出FSD订阅包,EAP车主99美元/月,未开通EAP的BAP车主199美元/月。
特斯拉FSD在全球的整体开通率约为11%,其中北美地区比例最高。根据Troyteslike数据显示,受到低价的Model 3及Model Y高速放量,以及FSD不断涨价的影响,特斯拉FSD在全球的整体开通率持续下滑,截至2021Q2结束,特斯拉FSD的整体开通率约为11%。预计特斯拉FSD在全球的累计开通数量近36万套(北美超过26万套,欧洲接近9万套,亚太地区仅5700套),平均选装价格为6千美元,其总销售额超过210亿美元。特斯拉FSD在亚洲地区销量持续攀升,但是FSD开通率整体偏低。以北美地区为例,Model S/X的FSD选装率在61%,Model Y的选装率在20%,Model 3的选装率在20%。
3、推出Dojo超算平台,打造感知自主进化的闭环学习系统。
特斯拉依托庞大客户群来收集自动驾驶数据,从而实现对深度学习系统的模型训练。与一般的汽车厂商和科技公司不同,特斯拉的自动驾驶不是依靠内部测试获取自动驾驶的数据,而是通过其庞大的客户群和装载传感器的特斯拉车辆上收集数据,并进行功能升级。即使没有激活,AP系统仍可以收集有关其环境和潜在自动驾驶行为的数据,以馈送特斯拉的神经网络。该数据收集方法通常被称为影子模式(Shadow mode),即AP系统在车辆的后台运行而无法在驾驶中进行任何输入。
发布7nm工艺AI训练芯片D1,打造Dojo超算训练平台。在2021年8月的特斯拉AI Day上,特斯拉发布了最新的AI训练芯片D1,D1芯片采用台积电7nm工艺制造,核心面积达645平方毫米,集成了多达500亿个晶体管,共有四个64位超标量CPU核心,拥有多达354个训练节点,特别用于8×8乘法,支持FP32、BFP64、CFP8、INT16、INT8等各种数据指令格式,都是AI训练相关。D1芯片的FP32单精度浮点计算性能达22.6 TFlops,BF16/CFP8计算性能则可达362 TFlops。为了支撑AI训练的扩展性,D1芯片的互连带宽最高可达10TB/s,由多达576个通道组成,每个通道的带宽都有112Gbps,而热设计功耗仅为400W。Dojo是一种通过网络连接的分布式计算机架构,它具有高带宽、低延时等特点,将会使人工智能拥有更高速的学习能力,从而使Autopilot更加强大。Dojo超级平台的内核是D1芯片,25个D1芯片组建成一个“训练瓦”(Training tile),组成36 TB/s的带宽和9 Peta FLOPS(9千万亿次)算力。未来,Dojo还可以组合成为全球最强算力的超级计算机集群。
特斯拉不断打造基于数据驱动的算法闭环迭代系统。特斯拉将把针对自监督学习技术的研发放到绝对的优先级(注:这里的自监督学习就是无监督学习)。算法的迭代优化离不开基于大数据的训练,特斯拉依托海量的客户群获得优质的自动驾驶数据,利用Dojo超算平台,实现对视频进行无监督的大规模训练。
二、英伟达(NVIDIA):
打造全栈式工具链,持续领先高阶自动驾驶
1、Drive系列平台持续迭代,赋能自动驾驶生态。
英伟达自2015年推出NVIDIA Drive系列平台,赋能自动驾驶生态。英伟达自2015年开始推出面向座舱的DRIVE CX和面向驾驶的DRIVE PX,此后先后推出DRIVE PX2、Drive PX Xavier、DRIVE PX Pegasus、DRIVE AGX Orin等多个自动驾驶平台,而在SoC芯片方面,从Parker、Xavier、Orin到最新发布的Atlan。
(1)DRIVE PX:英伟达在CES 2015上推出了基于英伟达Maxwell GPU架构的第一代平台:搭载1颗Tegra X1的DRIVE CX,主要面向数字座舱,以及搭载2颗Tegra X1的DRIVE PX,主要面向自动驾驶;
(2)DRIVE PX2:英伟达在CES 2016推出了基于英伟达Pascal GPU架构的第二代平台DRIVE PX 2,主要由Tegra X2(Parker)和Pascal GPU组成,PX2有多个版本,主要可以分为单芯片版的AutoCruise、双芯片版的AutoChauffeur以及四芯片版的Fully Autonomous Driving。特斯拉自2016年HW 2.0开始搭载英伟达的定制版DRIVE PX2 AutoCruise版本,并在2017年的HW 2.5上升级为2颗Tegra X2(Parker);
(3)Drive PX Xavier:英伟达在CES 2017上推出了Xavier AI Car Supercomputer,并在CES 2018上重新发布命名为Drive PX Xavier,搭载一颗30 TOPS算力的Tegra Xavier芯片。Xavier平台是PX2的小型化高能效版,算力稍有提升的前提下,面积缩小为PX2的一半,功率仅为PX2的1/8左右。该平台目前搭载在小鹏P5与P7车型上。
(4)DRIVE PX Pegasus:英伟达在2017年10月推出了DRIVE PX Pegasus,Pegasus定位更注重性能的提升。Pegasus共有四颗芯片,2颗Tegra Xavier芯片,2颗单独的Turing架构的GPU,每颗Xavier集成了一颗8核CPU和一个英伟达Volta架构的GPU,通过增加CPU和GPU,Pegasus平台可以实现320 TOPS的算力,功耗500 W。
(5)DRIVE AGX Orin:英伟达在中国GTC 2019大会上推出了DRIVE AGX Orin平台,该平台由2颗Orin SoC芯片和2颗Ampere架构的GPU,最高算力达到2000 TOPS,功耗800 W。
2、凭借GPU的资源禀赋,持续领先自动驾驶。
英伟达采用“CPU+GPU+ASIC”的技术路线。英伟达Xavier的芯片架构主要有4个模块:CPU、GPU、Deep Learning Accelerator(DLA)和Programmable Vision Accelerator(PVA)。其中GPU作为深度学习应用的首选,面积占比最大,CPU的面积其次,最小的部分是DLA与PVA是两个专用ASIC,DLA用于推理,PVA用于加速传统视觉算法。
单颗Orin SoC可实现254 TOPS算力,功耗低于55W,可支持单片或多片协同方案,实现算力扩展。Orin SoC芯片集成了Arm Hercules CPU内核、新一代架构Ampere的GPU、全新深度学习加速器(DLA)和计算机视觉加速器(PVA),可实现每秒254 TOPS运算性能,相比上一代Xavier系统级芯片运算性能提升了7倍。在运算性能提升巨大的情况下,Orin的功耗低于55 W。Orin可以覆盖10 TOPS到254 TOPS的算力需求、可以为终端用户提供可升级的方案支持单片或多片Orin协同的解决方案,无限扩展算力。
Orin所集成的GPU拥有2048个CUDA Core和64个Tensor Core。Orin内部集成了Ampere架构GPU,该GPU拥有2个GPC(Graphics Processing Clusters,图形处理簇),每个GPC包含4个TPC(Texture Processing Clusters,纹理处理簇),每个TPC包含2个SM(Streaming Multiprocesor,流处理器),每个SM下包含包含128个CUDA Core,合计2048个CUDA Core,算力为4096 GFLOPS。此外,还包括64个Tensor Core(张量核),Tensor Core是专为执行张量或矩阵运算而设计的专用执行单元,稀疏INT8模型下算力达131TOPS,或者密集INT8下54 TOPS。
蔚来ET7成为Orin系列的首发量产车,NIO Adam超算平台搭载四颗Orin芯片,单车算力打造1016 TOPS。蔚来NIO Adam超算平台,配备四颗Orin芯片,Adam拥有48个CPU内核,256个矩阵运算单元,8096个浮点运算单元,共计680亿个晶体管,总算力高达1016 TOPS。Adam平台集成了安全自主运行所需的冗余和多样性,在4颗Orin SoC中,前两颗Orin SoC负责处理车辆传感器每秒产生的高达8G的数据量,第三颗Orin SoC作为后备,以确保系统能够在任何情况下安全运行,第四颗Orin SoC可进行本地的模型训练,进一步提升车辆自身的学习能力,并基于用户偏好提供个性化驾驶体验。蔚来ET7将作为NVIDIA DRIVE Orin系列的首发量产车于2022年3月开始交付,同样搭载NIO Adam超算平台的蔚来ET5将于2022年9月开始交付。
英伟达发布Atlan SoC芯片平台,首次集成DPU,单颗芯片算力超过1000 TOPS。在2021年4月的英伟达春季GTC大会,英伟达发布了下一代自动驾驶芯片Atlan SoC芯片平台。Atlan可以和Orin和Xavier平台的软件堆栈兼容,Atlan采用5nm制程,单颗算力达到1000 TOPS,相当于Orin的4倍。Atlan平台采用新型Arm CPU内核、新一代的GPU、最新的DLA深度学习加速器、PVA计算机视觉加速器、并内置为先进的网络、存储和安全服务的BlueField DPU,网络速度可达400Gbps,这也是DRIVE平台首次集成DPU。Atlan SoC
将于2023年向开发者提供样品,并于2025年大规模量产上车。
当前,英伟达在自动驾驶领域遥遥领先,持续获得大量自动驾驶客户,英伟达的客户大致可以分为三类:造车新势力、传统车企、自动驾驶公司。(1)造车新势力:蔚来(ET5、ET7)、小鹏(P5、P7、G9)、理想(X01)、威马(M7)、上汽智己、R汽车、FF等;(2)传统车企:奔驰、沃尔沃、现代、奥迪、Lotus等;(3)自动驾驶Robotruck/Robotaxi公司:通用Cruise、亚马逊Zoox、中国的滴滴,沃尔沃商用车、Kodiak、图森未来、智加科技、AutoX、小马智
行、文远知行等。
3、打造端到端的自动驾驶平台,创造开放高效的研发生态。
英伟达提供包括从芯片、硬件平台、系统软件、功能软件、应用软件以及仿真测试平台和训练平台在内的全栈工具链。以英伟达DRIVE AGX硬件开发平台为起点,在DRIVE Constellation上验证软件算法。充分验证后将部署软件,通过DRIVE Hyperion参考架构进行上路测试。利用DGX高性能训练服务器进行深度学习模型训练,此过程反复迭代。英伟达提供了从芯片(Xavier/Orin/Atlan)、DRIVE AGX硬件平台、DRIVE OS、Driveworks、DRIVE AV自动驾驶软件栈、DRIVE Hyperion数据采集和开发验证套件、DRIVE Constellation虚拟仿真平台和DGX高性能训练平台等全栈工具链。
英伟达Drive自动驾驶平台为客户打造端到端的、开放、高效的研发生态。其核心优势可以总结为以下四点:
(1)软硬件解耦:其平台高度解耦,可独立升级,支持硬件升级路线和软件升级路线分别独立;
(2)硬件优势:英伟达作为GPU领导者,在硬件优势明显;
(3)生态完善:拥有业界最完善的官方开发套件,开发者社区相对完善;
(4)生态开放:软件层面开放程度较高,可在DriveWorks(功能软件层)开放API,也可在Drive AV和Drive IX(应用软件层)开放API;(5)研发捆绑:深度学习算法加速全部基于英伟达自身CUDA和TensorRT进行,使其软件开发和软件研发体系不可脱离英伟达平台。
三、高通(Qualcomm):
智能座舱一骑绝尘,自动驾驶不断追赶
1、打造“数字底盘”,全面布局智能汽车四大领域。
高通是作为消费电子霸主,持续布局智能网联汽车业务。在2019年推出第三代座舱平台8155,并于2021年发布第四代座舱平台8295;在自动驾驶领域,高通于2019年发布了Ride自动驾驶平台。高通目前已拥有25家以上的头部车企客户,公司业务已经覆盖全球超过2亿辆的智能网联汽车,高通在智能汽车领域的版图不断扩张。
高通基于车云、座舱、驾驶及车联四大平台打造数字底盘。高通在汽车业务领域志在打造“数字底盘”,主要由四部分组成:骁龙车云平台(Snapdragon Car-to-Cloud)、骁龙座舱平台(Snapdragon Cockpit Platform、骁龙驾驶平台(Snapdragon Ride Platform)、骁龙车联平台(Snapdragon Auto connectivity Platform),打造开放、可定制、可升级、智能互联的电子底盘,帮助Tier 1和OEM主机厂提升客户体验。
高通汽车业务营收快速增长。FY2021高通汽车业务营收达到9.75亿美元,同比增长51.40%,高通19-21年汽车业务营收分别为6.40/6.44/9.75亿美元,高通预计五年后汽车业务营收规模将达到35亿美元,预计10年后汽车业务营收规模将达到80亿美元。
2、智能座舱一骑绝尘,中高端数字座舱呈垄断地位。
高通在智能座舱芯片领域一骑绝尘。从高通2014年推出第一代座舱芯片602A开始,再到第二代820A以及第三代8155芯片,市场渗透率持续提升,能够发现,近期最初的新车型其座舱几乎都是搭载了高通8155芯片。目前,包括奔驰、奥迪、保时捷、捷豹路虎、本田、吉利、长城、广汽、比亚迪、领克、小鹏、理想智造、威马汽车在内的国内外领先汽车制造商均已推出或宣布推出搭载骁龙汽车数字座舱平台的车型。
高通骁龙SA8155P芯片是目前量产车可以选用的性能最强的座舱SoC芯片。高通第三代座舱芯片SA8155P平台是基于台积电第一代7nm工艺打造的SoC,也是第一款7nm工艺打造的车规级数字座舱SoC,性能上,8155芯片是目前量产车可以选用的性能最强的座舱SoC芯片,目前全球最大的25家车企已有20家采用高通第三代座舱8155芯片。8155平台属于多核异构的系统,性能是原820平台的三倍,该平台拥有极强的异构计算的能力,包括多核AI计算单元、Spectra ISP、Kryo 435 CPU、Hexagon DSP第六代Adreno 640GPU。Hexagon DSP中增加了向量扩展内核(Hexagon Vector eXtensions,HVX)和张量加速器(Hexagon Tensor Accelerator,HTA),这些专用AI计算模块能大幅提高芯片的AI算力。
高通发布第四代智能座舱SA8295P平台,性能显著提升。2021年7月,高通发布了第四代座舱平台的SA8295P,采用5nm制程,采用第六代八核Kyro 680 CPU和Adreno 660 GPU,支持同步处理仪表盘、座舱屏、AR-HUD、后座显示屏、电子后视镜等多屏场景需求,CPU、GPU等主要计算单元的计算能力较8155提升50%以上,主线能力有超过100%的提升。
百度旗下集度汽车成为高通8295的首发,量产车型预计在2023年交付。2021年11月29日,集度、百度和高通三方在上海进行了签约仪式,集度汽车成为高通8295的首发,集度旗下首款汽车机器人预计将于2023年量产交付,此外高通8295芯片已经获得长城、广汽、通用等车厂的定点,相关车型预计在2023年交付。
中科创达在CES 2022发布基于高通SA8295硬件平台的全新智能座舱解决方案。该解决方案充分发挥SA8295在算力、图形、图像处理等方面的突出性能,打造了包含数字仪表、中控娱乐、副驾娱乐、双后座娱乐、流媒体后视镜和抬头显示器的一芯多屏智能座舱域控。公司基于深厚的车载OS技术,创新性地打通座舱和自驾两大技术域,更好地支持360°环视和智能泊车功能,基于座舱域的冗余算力,在实现安全可靠的低速泊车的同时降低了方案成本。
3、发布Ride平台,收购Venoeer,持续补强驾驶域。
高通在CES 2020大会上发布了其自动驾驶Snapdragon Ride平台,支持自动驾驶平台的开发。高通在CES 2020上推出全新自动驾驶平台高通Snapdragon Ride,该平台基于一系列不同的骁龙汽车SoC和加速器建立。它采用了可扩展且模块化的高性能异构多核CPU、高能效的AI与计算机视觉引擎,以及业界领先的GPU。同时,该平台还包括Snapdragon Ride安全系统级芯片(SoC)、Snapdragon Ride安全加速器和Snapdragon Ride自动驾驶软件栈(Autonomous Stack)。
Snapdragon Ride软件平台包括:规划堆栈、定位堆栈、感知融合堆栈、系统框架、核心软件开发工具包(SDK)、操作系统和硬件系统。高通推出的专门面向自动驾驶的软件栈,是集成在Snapdragon Ride平台中的模块化可扩展解决方案,旨在帮助汽车制造商和一级供应商加速开发和创新。该软件栈通过面向复杂用例而优化的软件和应用,助力汽车制造商为日常驾驶带来更高的安全性和舒适性,例如自动导航的类人高速公路驾驶,以及提供感知、定位、传感器融合和行为规划等模块化选项。Snapdragon Ride平台的软件框架支持同时托管客户特定的软件栈组件和Snapdragon Ride自动驾驶软件栈组件。
高通收购维宁尔旗下软件业务Arriver,全面补强自动驾驶域。维宁尔(Veoneer)总部位于瑞典斯德哥尔摩,前身是全球最大的安全气囊和安全带生产商奥托立夫(Autoliv)公司电子事业部,2018年从奥托立夫拆分出来,维宁尔致力于自动驾驶汽车的高级辅助系统(ADAS)和协作式自动驾驶系统(AD)领域的研发,拥有雷达系统、ADAS电子控制单元(ECU)、视觉系统、激光雷达系统和热成像等产品。Veoneer在2020年将ADAS、协作和自动软件开发集中在一个部门并命名为Arriver。
集成Arriver视觉感知软件栈,推出Snapdragon Ride Vision视觉系统。高通在CES 2022上发布了Snapdragon Ride Vision视觉系统,该系统拥有全新的开放、可扩展、模块化计算机视觉软件栈,基于4纳米制程的系统级SoC芯片打造,旨在优化前视和环视摄像头部署,支持先进驾驶辅助系统(ADAS)和自动驾驶(AD)。
4、主机厂合作不断增加,相关量产车型落地在即。
自高通在2020年初推出Snapdragon Ride自动驾驶平台后,目前已经与通用、长城、宝马等多家主机车厂达成合作,将在下一代新车上搭载Ride平台,相关量产车型落地在即。
(1)通用(GM):
通用将在下一代Ultra Cruise驾驶辅助系统搭载高通Ride平台。高通在CES 2020上宣布与通用集团在数字座舱、车载信息处理和ADAS领域开展合作。通用近期发布了其驾驶辅助系统Ultra Cruise计算平台,该平台由两个Snapdragon SA8540P SoC和一个SA9000P AI加速器组成,可在16核CPU上提供关键的低延迟控制功能,并为相机、雷达和激光雷达处理提供每秒超过300 Tera操作的高性能AI计算。SA8540P SoC采用5nm工艺技术设计,可实现卓越的性能和能效,将为Ultra Cruise的传感、感知、规划、定位、映射和驾驶员监控提供必要的带宽。通用汽车计划将在2023年在凯迪拉克旗下全新纯电动CELESTIQ首发上市,并配置自主研发的Ultra Cruise软件栈,覆盖95%驾驶场景的可放开双手自动驾驶。
(2)长城汽车:
长城汽车与高通在自动驾驶领域达成合作,相关量产车将在2022年量产。2020年12月,长城汽车与高通宣布双方在自动驾驶领域达成合作,长城汽车将率先采用高通Snapdragon Ride平台,打造先进的高算力智能驾驶系统——长城汽车咖啡智驾系统,并在2022年量产的长城汽车高端车型中采用,长城汽车是国内首批采用高通Snapdragon Ride平台的整车厂商。2021年7月正式发布搭载高通Snapdragon Ride平台的自动驾驶平台ICU 3.0,搭载这一平台的量产车型将于2022年二季度正式交付。
长城旗下毫末知行在CES 2022上推出基于高通Ride平台的域控制器。毫末智行成立于2019年11月,前身是长城汽车的智能驾驶部,毫末智行在两年的发展过程中,拥有了全栈自研自动驾驶解决方案和数据智能中心,业务范围包括乘用车、无人物流车、智能硬件。毫末智行在2021年底的10亿元A轮融资中,高通创投参与了本轮投资,毫末知行的投后估值超过10亿美元。在CES 2022大会上,毫末智行联合高通全球算力最高的可量产自动驾驶计算平台毫末智行小魔盒3.0,其平台单板算力达360TOPS,可持续升级到1440TOPS。这也是高通5nm自动驾驶计算平台的全球首发量产。SA8540P SoC+SA9000的组合,支持接入6路千兆以太网/12路800万像素摄像头/5路毫米波雷达/3路激光雷达,可以做L1/L2级别的降级控制,也可以满足当前L3以及后续L4/L5等全场景自动驾驶功能的实现。
(3)宝马集团:
高通与宝马集团在自动驾驶领域达成合作,相关车型将在2025年量产。在2021年11月的高通投资者大会上,高通宣布与宝马集团在自动驾驶领域达成合作,宝马的下一代车型将采用高通Snapdragon Ride自动驾驶平台,其中包括高通的中央计算SoC等多个核心部件,新款车型将在2025年量产。
四、Mobileye:
ADAS赛道的先行者,当前市占率第一
1、ADAS赛道的先行者,EyeQ系列累计出货量过亿片。
Mobileye自1999年便开始专注于ADAS赛道。Mobileye于1999年由以色列希伯来大学的Amoon Shashua教授和Ziv Aviram创立,靠视觉算法起家,主要业务是开发自动驾驶相关的系统和EyeQ系列芯片。2007年,Mobileye的EyeQ1开始在宝马、通用和沃尔沃等车企量产上车,2008年发布了EyeQ2,尤其在2014年推出EyeQ3后一举成名,同时于2014年在美国纳斯达克上市,市值高达80亿美元。在2017年由英特尔以153亿美元收购,从而私有化退市,成为英特尔旗下自动驾驶业务部门。英特尔计划在2022年中让Mobileye独立在美上市。
Mobileye在2021年Q3营业收入同比增长39%,18-20年营收复合增速18%。2021年Mobileye拿到了30多家车企的41项新订单,涉及约5000万辆新车搭载。根据英特尔财报显示,Mobileye在2021年Q3营业收入3.26亿美元,同比增长39%。Mobileye的营业收入从2018年的6.98亿美元提升到2020年9.67亿美元,复合增速为17.7%。
从2007年至今,Mobileye EyeQ系列芯片累计出货量超过1亿颗。Mobileye的EyeQ1自2007年在宝马、通用和沃尔沃量产上车以来,截至目前,公司EyeQ系列芯片已经完成1亿颗的出货。Mobileye EyeQ系列芯片出货量也在持续增加,但是增速逐渐放缓,EyeQ系列芯片销量从2018-2021年分别为1240万、1750万、1930和2810万颗,同比增长率43%/41%/10%/46%。
Mobileye市场占有率依旧领先,正在逐渐掉队。在过去20年时间里,Mobileye以视觉感知技术为基础,推出了算法+EyeQ系列芯片组成的一系列解决方案,帮助车企实现从L0级的碰撞预警,到L1级的AEB紧急制动、ACC自适应巡航,再到L2级的ICC集成式巡航等各种功能,Mobileye当前仍然以36.29%的市场份额排名第一,包括宝马、沃尔沃、奥迪、蔚来、长城等一系列国内外车企,甚至特斯拉都曾搭载过EyeQ系列芯片。但是,Mobileye正在逐渐掉队,例如,宝马在2016年与Mobileye组建了自动驾驶联盟,但是在前不久已经与高通Ride达成合作,蔚来、理想等一批车企则选择了在新一代车型上搭载英伟达Orin芯片。
2、产品功耗优势显著,算法生态相对封闭。
Mobileye EyeQ系列芯片从2007年发布至今,目前一共有五代产品:
EyeQ5:2018年发布,2021年量产上市,由台积电代工,采用7nmFinFET工艺,EyeQ5系统采用了双路CPU,使用了8颗核心处理器、18核视觉处理器,算力为24 TOPS,功耗为10W。
EyeQ5采用“CPU+ASIC”架构,功耗极低,但生态相对封闭。EyeQ5主要有4个模块:CPU、Computer Vision Processors(CVP),Deep Learning Accelerator(DLA)、Multithreaded Accelerator(MA),其中CVP是针对传统计算机视觉算法设计的ASIC模块,用专有的ASIC来运行这些算法而达到极低功耗而闻名。但是其算法系统相对封闭,对OEM和Tier 1来说是黑盒,他们无法进行二次修改从而差异化自己的算法功能。Mobileye的算法解决方案还是以传统计算机视觉算法为主,深度学习算法为辅,这也直接决定了其以CVP为主,DLA为辅的架构。
3、发布高算力先进制程芯片,布局高阶自动驾驶。
Mobileye在近年的CES 2022大会上发布了三款最新的芯片EyeQ Ultra、EyeQ6 Light和EyeQ6 High。此外,Mobileye与吉利汽车集团的极氪共同宣布,将在在2024年前推出具有L4能力的纯电新车,新车基于吉利SEA平台打造,使用6颗EyeQ 5芯片,以处理Mobileye的驾驶策略及地图技术的开放协作模型。同时,新车将,双方将在软件技术方面进行有效集成。
EyeQ Ultra:面向L4级自动驾驶,基于5nm制程打造,算力176 TOPS,大约为10颗EyeQ5芯片的性能。EyeQ Ultra具备12核、24线程CPU,同时还有两个通用计算加速器和两个CNN加速器。EyeQ Ultra预计将在2023年提供样品,2025年实现量产上车;
EyeQ6 High:面向L2级自动驾驶,基于7nm制程打造,算力34 TOPS,EyeQ6 High具备8核、32线程的CPU,两个通用计算加速器和两个CNN加速器。EyeQ6 High预计2022年开始提供样品,2024年实现量产;
EyeQ6 Light:面向L1-L2级自动驾驶,基于7nm制程打造,算力5 TOPS。EyeQ6 Light具备2核、8线程CPU,1个通用计算加速器和1个CNN加速器。为上一代EyeQ4的迭代版本,但封装尺寸为EyeQ4的55%。预计2023年实现量产。
五、华为:
以ICT技术全面赋能汽车智能化
1、坚定“平台+生态”战略,布局五大业务板块。
华为智能汽车解决方案包括五大业务板块:智能网联、智能驾驶、智能座舱、智能电动、智能车云服务。华为自2014年成立车联网实验室,便开始面向智能网联汽车领域储备技术,2019年5月份,华为正式成立了智能汽车解决方案BU,开始全面进军智能汽车赛道。华为提出了代表计算和通信的CC架构,用分布式网络+域控制器的架构,将车辆分为三大部分:驾驶、座舱和整车控制,推出了基于CC架构的三大平台智能驾驶平台(MDC)、智能座舱平台(CDC)和整车控制平台(VDC)。华为坚持“平台+生态”的发展战略,聚焦ICT技术,围绕iDVP、MDC和HarmonyOS智能座舱三大平台,构建生态圈,携手合作伙伴帮助车企造好车。
打造开放共赢的iDVP智能汽车数字底座,实现软硬件分层解耦。在智能汽车数字架构中,华为提供智能汽车数字平台的基础要素iDVP,i是智能、D是数字、V是汽车、P是平台,包括计算与通信架构CCA、车载操作系统、多域协同软件框架HAS Core和完善的整车级工具链,构建硬件生态和软件生态,与伙伴们联合定义硬件接口和软件接口,联合开发原子化服务,实现软硬件分层解耦,帮助车企快速开发跨厂家、跨设备的应用,为用户带来持续进化的体验。华为积极参与产业联盟,建立共识,基于自身实践,贡献行业标准。
2、基于华为MDC计算平台,打造开发共赢的智能驾驶生态。
华为MDC(Mobile Data Center,移动数据中心)定位为智能驾驶的计算平台,集成华为在ICT领域30多年的研发与生产制造经验,为开发者提供全场景覆盖的工具链与丰富的SDK,支持伙伴的软件开发和移植,同时满足智能驾驶应用对车规、安全的核心要求。目前,已经有70多家合作伙伴加入了MDC生态圈,联合推进乘用车、港口、矿卡、园区等智能驾驶场景的试点与商用。
华为MDC平台遵循平台化与标准化原则,包括平台硬件、平台软件服务、功能软件平台、配套工具链及端云协同服务,支持组件服务化、接口标准化、开发工具化;软硬件解耦,一套软件架构,不同硬件配置,支持L2+~L5的平滑演进,保护客户或生态合作伙伴的应用软件开发的历史投资。MDC自动驾驶平台的系统架构是可伸缩的,通过对CPU内核数,人工智能加速内核搭载数量以及IO接口数量的增减,可满足高、中、低端乘用车从驾驶辅助到高端智能驾驶的不同使用场景。
华为MDC采用CPU+NPU路线。以华为2018年发布的MDC 300F为例,集成了华为自研的Host CPU芯片、AI芯片、ISP芯片与SSD控制芯片。CPU芯片:华为自研的鲲鹏920处理器,基于ARM架构,采用7nm工艺,2.0GHz,最大功耗55W;NPU芯片:华为自研的昇腾310处理器,基于达芬奇AI架构,可以提供16TOPS@INT8的算力,采用12nm工艺,最大功耗8W。
同算法组件组合及应用。华为MDC平台支持智能驾驶相关的多种传感器、执行器、IVI或T-Box等周边模块的接入,支持丰富、灵活可变的主流硬件标准化接口,如GMSL、CAN、CAN-FD、Automotive-Ethernet等,提供广泛的兼容性与选择灵活性。同时,华为MDC功能软件基于SOA架构,遵循AUTOSAR规范,定义了智能驾驶基本算法组件,能够实现感知算法组件、融合算法组件、定位算法组件、决策算法组件、规划算法组件、控制算法组件的调用框架与组件之间的软件接口。上层场景应用可以灵活选择不同的算法组件组合,实现具体的场景应用功能。
华为MDC产品线逐渐完善,陆续发布MDC 300F/210/610/810多款产品,覆盖从L2+~L5全场景自动驾驶应用。在2019年,华为正式推出了MDC 300F,算力64 TOPS,面向商用车场景,华为正式开启了MDC生态建设;2020年9月,在华为智能汽车解决方案生态论坛上,华为发布了MDC 210与MDC 610,前者算力达48 TOPS,适用于L2+自动驾驶,后者算力达200+TOPS,适用于L3/L4级别自动驾驶;2021年,在上海车展上,华为发布了MDC 810,算力达到400+TOPS;华为计划在2022年发布MDC 100,进一步丰富MDC产品线。
华为还提供了一系列的华为MDC开发者套件包括MDC工具链、MDC Core SDK和车云协同开放平台。在华为MDC平台硬件上,运行着智能驾驶操作系统AOS、VOS及MDC Core,并配套提供完善的开发工具链。基于华为MDC平台的操作系统、平台软件与功能软件中间件,均对外提供标准的开放API与SDK开发包,结合简单易用的工具链,助力客户或生态合作伙伴研发效率提升,实现智能驾驶应用的快速开发、调测、部署与运行。
华为与合作伙伴的合作分为两种模式:
一种是Huawei Inside模式,即华为提供包含智能驾驶应用软件、计算平台以及传感器在内的智能驾驶全栈解决方案。
另一种是MDC平台模式,华为提供MDC智能驾驶计算平台,主要包括SOC硬件、自动驾驶操作系统、车控操作系统,以及AutoSAR中间件。
目前,一共有北汽、广汽、长安、小康赛力斯、长城五家车厂确定搭载华为MDC平台。在2021年的广州车展上,广汽埃安LX Plus和长城沙龙机甲龙都选择了MDC作为智能驾驶计算平台。除此之外,北汽新能源旗下的极狐阿尔法,小康赛力斯SF5和问界M5、长安阿维塔11也都确定搭载华为MDC平台。
3、打造万物互联的HarmonyOS智能座舱生态。
华为于2020年8月14日公布了三大鸿蒙车载OS系统——鸿蒙座舱操作系统HOS、智能驾驶操作系统AOS和智能车控操作系统VOS。华为致力于以硬件模块化、接口标准化、系统平台化为目标,围绕HarmonyOS车机操作系统构建智能座舱生态,目前,华为在HarmonyOS操作系统上增量开发了9类车载增强能力、开放1517个车载业务API、13000多个HarmonyOS的API,并提供全面开放的工具和技术支持,降低座舱系统的集成与开发难度,帮助伙伴快速开发和迁移应用,为用户带来丰富的人车生活体验。
基于HarmonyOS,华为已经与150多家软硬件伙伴们建立合作。联合定义硬件接口,做到硬件即插即用、可替换升级、多样化硬件之间互联互通,并通过API接口开放给应用,快速开发全场景覆盖、多设备协同的座舱系统,为消费者提供个性化、智能化、多样化的服务体验。在华为最新的座舱demo上,已经部署了合作伙伴的车载天幕、电子后视镜、全息投影、转向系统和智能健康座椅等多款鸿蒙周边设备。
华为打造真正智能化、万物连接的HarmonyOS智能座舱生态。华为智能座舱“一芯多屏”解决方案能够让座舱内的液晶仪表、AR-HUD(平视显示器)、中央显示、中央娱乐屏、中控屏、副驾屏等均由同一芯片提供性能支持。华为围绕HarmonyOS车机操作系统,主要通过三种方式来构建‘应用丰富,体验多样,常用常新’的智能座舱应用生态:(1)针对车域高频使用的应用,和伙伴们一起针对基于HarmonyOS车域特性能力进行深度适配,打造HarmonyOS精品应用;(2)基于华为1+8的全场景生态能力,手机,平板,智慧大屏的应用可以无缝继承上车;(3)针对不常用的长尾应用,HarmonyOS车机操作系统同时提供手机投屏能力,满足用户多样化的体验需求。
六、地平线:
实现国产车规级AI芯片从0到1的突破
1、国产车规级AI芯片先行者,芯片累计出货量超100万颗。
地平线是目前国内唯一一家车规级AI芯片大规模前装量产的企业。地平线于2015年由人工智能和深度学习科学家余凯博士创立成立,地平线于2019年发布中国首款车规级AI芯片征程2后,并于2020年实现前装量产,目前地平线共有三代产品征程2(2019年发布)、征程3(2020年发布)和征程5(2021年)。地平线还会推出性能更强的征程6,采用7nm工艺,算力超过400 TOPS。目前,征程5已获车型定点,量产时间2022年下半年,征程6预计工程样片的推出时间是2023年,量产时间是2024年。
地平线拥有众多汽车产业链相关的股东,有助于公司获得更多主机厂客户。地平线在2021年7月完成了15亿美元C7轮融资,投后估值高达50亿美元。在过往的融资中,上汽、广汽、比亚迪、东风、长城等主机厂参与了地平线的融资,在汽车产业链相关公司还包括宁德时代、韦尔股份、舜宇光学、京东方、星宇股份等。
地平线征程系列芯片累计出货突破100万颗,主机厂客户不断突破。截至2021年1月,地平线征程系列芯片出货量已突破100万颗,已拿下了超过40个前装量产项目。自2020年3月首款征程2芯片的长安UNI-T车型上市以来,地平线已同长安、上汽、广汽、一汽、理想、奇瑞、长城,以及奥迪、大陆集团、佛吉亚等国内外知名主机厂及Tier1深度合作。
2、自研AI加速器BPU,发挥极致的算力效能。
地平线采用“CPU+ASIC”技术路线,自研AI加速器BPU(ASIC)。以地平线征程2芯片为例,采用地平线自研的伯努利1.0架构的BPU(ASIC芯片),CPU采用双核ARM Cortex-A53,征程2的等效算力超过4 TOPS,功耗仅为2W,达到车规级AEC-Q100标准,典型算法模型在征程2芯片的利用率可高于90%。
地平线自主设计研发的人工智能专用计算架构BPU已经推出了五种三代AI架构。地平线自主设计研发了人工智能专用计算架构Brain Processing Unit(BPU),目前已经推出了五种三代AI架构:高斯架构、伯努利1.0架构(用于征程2芯片)、伯努利2.0架构(用于征程3芯片)、贝叶斯架构(用于征程5芯片),而在下一代征程6芯片将集成第四代BPU架构(纳什架构)。
3、软硬结合,打造“算法+芯片+工具链”的自动驾驶生态。
地平线以“算法+芯片+工具链”为基础,打造“天工开物”AI开发平台。地平线基于地平线自研AI芯片打造的“开工开物”AI全生命周期开发平台:包含模型仓库(Model Zoo)、AI芯片工具链(AI Toolchain)、AI应用开发中间件(AI Express)三大功能模块。开发者配合地平线AI工具链,适配主流的训练框架Caffe、MXNet、TensorFlow和PyTorch,支持ONNX,并提供模型仓库,加速客户开发和部署自有算法,提高客户产品应用开发效率。
模型仓库(Model Zoo):产品级算法、基础算法和产品参考算法三类算法资源。赋能地平线芯片合作伙伴更快、更省地开发出自己的人工智能产品;
AI芯片工具链(AI Toolchain):量化训练工具和浮点定点转换工具,为地平线芯片开发者提供模型训练、模型转换、应用开发和部署等基础工具;
AI应用开发中间件(AI Express):XStream和XProto两套应用开发框架,提供丰富的、高度可复用的算法模块、业务策略模块、应用组件和场景应用参考方案,旨在加速客户从业务模型集成到应用程序开发流程。
地平线打造了最新的自动驾驶参考平台Matrix 5,算力高达512 TOPS。地平线于2020年推出了基于4颗征程2芯片的Matrix 2计算平台,最高算力可达16 TOPS。地平线于2021年推出其最新的自动驾驶参考平台Matrix 5,该计算平台基于4颗征程5,算力高达512 TOPS,能够满足ADAS、高阶自动驾驶、智能座舱等多场景需求并且拥有丰富的接口,包括48GMSL2摄像头输入通路,最高可支持多路8MP@30fps、多路毫米波雷达、4D成像雷达、激光雷达、超声波及麦克风阵列的接入,使车内外能够实现全方位、多模态感知。
七、相关公司:
中科创达、德赛西威、光庭信息、东软集团、四维图新、经纬恒润
中科创达(300496.SZ):全球领先的智能平台技术服务提供商。
德赛西威(002920.SZ):汽车电子Tier 1龙头,ADAS先发优势显著。
光庭信息(301221.SZ):领先的智能汽车软件解决方案提供商。
东软集团(600718.SH):智能汽车浪潮为老牌软件龙头注入活力。
四维图新(002405.SZ):地图为基、芯片铸魂,打造汽车智能领导者。
经纬恒润(A21257.SH):领先的综合电子系统科技服务龙头。
文章首发-公众号:钻石研报。