智能驾驶芯片成本估算市场分析
智能驾驶芯片成本估算市场分析
特斯拉、高通、英伟达智能驾驶芯片成本估算
芯片的成本可以分为裸晶制造、封装、流片、研发(包括外购IP)四个主要部分。其中:
- 裸晶制造主要是在晶圆代工厂生产芯片并做KGD测试;
- 封装是指裸晶生产完毕送到封装厂进行测试后封装;
- 流片是芯片设计公司第一次验证性质的生产,把电路转刻到光罩(又叫掩膜),从RTL网表到芯片,芯片流片过程至少持续三个月(包括原料准备、光刻、掺杂、电镀、封装测试),一般要经过1000多道工艺,生产周期较长,因此也是芯片制造中最重要最耗钱的环节,并且这个费用是一次性的,如果流片失败,还需要重新来过,费用翻倍;
- 研发成本中很大一项是外购IP,一般是ARM的架构IP,大公司是彻底买断,小公司则是买一个License,每做一个芯片就要买一个License。
封测包括封装和测试,车载芯片为了通过AEC-Q100,封装成本较其他芯片要高,功率越高,封装成本越高,大概能占到芯片制造成本的40%,再加上大约10%的测试以及物流,合计封装成本占到芯片制造成本的一半。顺便说一下,全球最大的汽车芯片封装厂家是AMKOR,2022年其汽车领域收入达29亿美元。

数据来源:台积电
上表是台积电的晶圆代工到芯片的成本分析,三星的代工价格会比这个低得多。对芯片来说,芯片面积即Die Size是与成本关联度最高的指标。
- Die Size越大,每片12英寸晶圆切割的数量就越少,而每片12英寸晶圆的成本是固定的,同时Die Size超过800平方毫米后,良率会迅速下降,成本会大幅度增加。
- Die Size主要取决于制造工艺,制造工艺越先进,晶体管密度就越高,同样晶体管数量成本就低,但是进入5纳米后晶圆成本的上涨抵消了密度提高带来的红利,成本不仅没有降低,反而略有上涨,另一方面也取决于芯片厂家的设计,比如GPU和FPGA,因为单元(cell)规整程度很高,很难做线路优化,同样密度下Die Size会远比传统SoC要大。
目前,自动驾驶芯片主要有高通的SA8540P+SA9000B,英伟达的Xavier、Orin和Thor,特斯拉的一代和二代FSD。
高通的SA8540P+SA9000B,即高通Ride 3.0平台。 -
![]()
图片来源:高通
高通Ride 3.0版,内部代号Cetus。图上可以看出开发平台有16路摄像头输入,12路车载百兆以太网输入,4路车载千兆以太网输入。高通Ride3.0参考硬件包括Cetus V1主板,MCU为英飞凌TC397,MakenaAU SIP承载卡即SA8540P的承载卡,Qranium卡即SA9000P。GMSL的摄像头输入板,对应安森美AR231摄像头,带散热器的PCIe交换器板,基于英特尔芯片的视频卡,千兆以太网卡。基础软件包括Ubuntu 20.04,QNX的SDP 7.1.0,QNX PCIe交换库,高通英飞凌AURIX 2.0.8,高通CDT即QDrive 3.0,还有高通QDrive ES4.3。高通平台使用CDT(Configure Data Table)来存储平台信息和内存参数,CDT默认以数组方式存放在boot_images的源文件中,并最终编译到sbl1中;CDT也可以保存到UFS或eMMC中,在启动过程中加载。
根据https://www.volza.com/p/hsn-code-90304000/export/中进出口代码的判断10 PW172 011S DTP TOP ASSEMBLY ADP STAR KIRKWOOD MAIN CARD V2 SA8295P-SA8540P MAKENAAU V1 PMM8295AU V1 RCM DESIGNING TE,基本上可以确定高通的SA8540P与SA8295P相差无几,两者的ADP即汽车开发平台属同一个名称下,MakenaAU也对应了高通Ride 3.0板中的MakenaAU。两者又都是5纳米工艺。
图片来源:毫末智行
单颗SA8295P的CPU算力也是200k DMIPS,不难推断,SA8295P与SA8540P基本相差无几。
https://www.phoronix.com/news/Qualcomm-QAIC-Cloud-Accelerator,据前面网址,AI100和SA9000P的Linux驱动完全一致,不难推断两者差别很小,高通也仅有这一款加速器,于2021年下半年量产。谷歌搜索qranium qualcomm,头条也是高通的AI100。
![]()
图片来源:高通
高通AI100有多个版本,主要差别是内核数量和SRAM。顶配采用16核设计,每核配备9MB的SRAM,SA9000P也是144MB的SRAM,可能为了降低功率,频率有所降低,AI100频率是2.1GHz,SA9000P可能降低至1.9或2.0GHz,算力也略微降低至360TOPS。在高通开发平台介绍中,参考硬件的算力只有200TOPS,可能是8核设计。SA9000P实际也有两个版本,高配版为SA9000P-B,低配版为SA9000P-A,算力就是200TOPS。
高通开发硬件平台的PCIe连接,两片SA8540P的载板(与SA8195P/SA8295P载板一致)与SA9000连接,同时还有M.2 SSD接口(就是实际上车的UFS)和万兆车载以太网。核心元件是Microchip的PCIe交换机,型号为PM43028B1-F3EI,价格比较高,约100美元一片,比SA8155P还贵。
SA8295的公开信息是有的。
SA8295P的车载开发平台![]()
图片来源:高通
根据SA8295P的公开介绍,可以发现SA8295P与高通笔记本电脑用的8cx Gen3代完全一致,仅在NPU上算力略高1TOPS,是30TOPS。
下图是有关高通8cx Gen3的介绍。
![]()
图片来源:推特
这个与高通手机用的骁龙888比较接近,骁龙888采用5nm制程,1 * 2.84GHz Cortex X1,3 * 2.4GHz Cortex A78,4 * 1.8GHz Cortex A55,8cx Gen3、SA8295、SA8540P是4个2.84GHz Cortex X1,4个1.8GHz Cortex A55,SA8295少了5G Modem,但它是4个X1超大核,NPU和GPU也略强,因此Die Size与骁龙888应该没差别,甚至可能更大。
根据SA9000P-B的算力以及高达144MB的SRAM缓存,估计其成本大约在250-300美元。
![]()
图片来源:特斯拉
上图是特斯拉第一代FSD芯片,采用三星14纳米工艺,流片成本估计不高,1000万美元左右,有60亿晶体管,260平方毫米,这在当时算是很大的芯片了。假设FSD生命周期内出货量为100万片,每片分摊流片成本大约10美元,估计FSD一代芯片包括购买IP的开发成本2亿美元,每片分摊成本为200美元。晶圆制造成本大约20美元每片,车载封测成本比较高,大概占晶圆制造的一半,也就是10美元,合计240美元,如果出货量为50万片,那成本就大幅增至440美元,所以特斯拉不急着推HW4.0。
![]()
图片来源:特斯拉
7纳米芯片一次性流片成本大约3000万美元,也就是大约2亿人民币。如果二代FSD出货量达到10万片,每片分摊的成本大约300美元;出货量30万片的话,每片分摊成本100美元;出货量100万片,每片分摊的成本大约30美元。其die尺寸看起来与英伟达Orin差不多,估计晶圆制造成本和封装成本为150美元。特斯拉2022年销量131万辆,按FSD选装率20%计算,按30万套计算,研发成本按900万美元,每片分摊30美元,成本大约为280美元;如果15万片的出货量,那么成本大概是410美元;如果10万片的话,那么成本是540美元。
二代FSD代工应该还是三星,三星的报价只有台积电的1/3甚至1/4,这也是台积电的营业利润率是三星5倍的主要原因。选择三星就不大可能选择不成熟的5纳米工艺,应该还是成熟的7纳米工艺,2023年中期,在特斯拉家门口的三星德州仪器奥斯汀厂就能量产7纳米芯片了。
英伟达芯片Die Size一向很大,即将在2025年量产的Thor有770亿个晶体管,面积估计有800平方毫米。英伟达的A100,有540亿个晶体管,面积有826平方毫米,不过是台积电7纳米工艺制造的,GH100是台积电4纳米工艺,有800亿个晶体管,面积有814平方毫米。
![]()
图片来源:英伟达
高通和英伟达都有分摊研发成本的办法,高通有庞大的手机芯片出货量,可以共用很多IP,按骁龙888出货量2500万片计算,流片成本就几乎可以忽略不计算,研发成本也可以分摊到很低。英伟达的Thor与英伟达GH100共用大部分IP,研发成本可以大幅度降低,GH100主打服务器领域,ChatGPT让30万美元一台的DGX-H100供不应求,里面主要的芯片就是GH100。
![]()
图片来源:中航证券
先进制程对应的开发成本,这里只是大概估计,软件的成本非常难以估计,各种芯片之间差异巨大,上图主要是说明先进工艺很贵,这里的Verification可能指的是流片,因为IC设计公司用EDA工具做验证几乎不花什么成本。5纳米流片的成本大概5000万美元,3纳米估计1亿美元。
主要自动驾驶芯片成本分析
![]()
数据来源:各公司资料及作者估算
英伟达和高通的芯片毛利率都很高,英伟达毛利率达65%,而高通整体毛利率为58%,不过专利授权部门的毛利率是超过70%的,估计芯片的毛利率大概是50%,这个成本未计入分摊流片的成本。当然价格和采购量也关系很密切,这里价格仅供参考。除此之外,都按100万片的生命周期出货量分摊成本。
全面盘点国内外八大头部企业自动驾驶芯片方案
芯片按应用场景可分为消费芯片、工业芯片、汽车芯片和军工芯片等。汽车是芯片应用场景之一,汽车芯片需要具备车规级。车规级芯片对加工工艺要求不高,但对质量要求高。需要经过的认证过程,包括质量管理标准ISO/TS 16949、可靠性标准AEC-Q100、功能安全标准ISO26262等。
汽车内不同用途的芯片要求也不同,美国制定的汽车电子标准把其分为5级。汽车各系统对芯片要求由高到低依次是:动力安全系统>车身控制系统>行驶控制系统>通信系统>娱乐系统。
车规级芯片特殊的技术和工艺要求挡住了企业进入的脚步。车规级芯片有着比消费级芯片更高的技术门槛,需满足温度、振动、电磁干扰、长使用寿命等高要求,还要通过可靠性标准AEC-Q100、质量管理标准ISO/TS16949、功能安全标准ISO26262等严苛的认证流程,大部分芯片企业尚不具备转型进入能力。
目前,车规级芯片在传统汽车中的成本约为2270元/车,在新能源汽车中的成本约为4540元/车。随着汽车向电动化和智能化发展,芯片的种类、数量和价格占比将进一步提高。
▍车规级芯片市场概况
车规级芯片领域长期被发达国家垄断。车规级芯片分为控制芯片、微处理器芯片、存储芯片、模拟芯片及功率器件等。当前,以美、欧、日、韩为代表的发达国家行业巨头,长期占据着车规级芯片的技术制高点和主要市场份额,欧、美、日分别占据37%、30%和25%的市场。行业内TOP8企业占据60%以上市场份额。
根据《智能网联技术路线2.0》对自动驾驶渗透率的预测,2025年中国L2/L3渗透率将达50%,2030年中国L2/L3渗透率70%,L4渗透率20%。基于此,预计2030年中国自动驾驶芯片的市场规模为813亿元,其中L2/L3芯片市场规模493亿元,L4/L5芯片市场规模320亿元;全球市场规模为2224亿元,L2/L3芯片市场规模1348亿元,L4/L5芯片市场规模876亿元。
▍英伟达:从游戏显卡到自动驾驶芯片
从游戏显卡到自动驾驶芯片
英伟达拥有极具前瞻性且清晰的战略能力。英伟达是全球最大的智能计算平台型公司,公司从早期专注PC图形计算,后来逐步将重点扩展到AI领域,并在3D图形的持续需求与游戏市场规模扩张推动下,利用GPU架构,创建VR、HPC(高性能计算)、AI平台。英伟达在独立显卡、GPU领域有超过70%的市场份额。除了优秀的硬件性能外,2006年英伟达开发了基于GPU的“CUDA”开发平台,让只做3D渲染的GPU实现通用计算功能,GPU的应用领域从游戏扩展至高性能计算、自动驾驶等多个领域。
2021年英伟达实现总收入269.1亿美元,游戏业务仍是支柱业务,占比近半,汽车部门收入5.6亿美金,占总收入比例2.08%。
革命性CUDA架构
到了2005年,主要的GPU制造商都使用顶点着色单元和像素渲染单元两种计算资源。然而,合理配置这两种资源的问题却始终没有得到完美解决。特别是两种处理器数量的最佳比例是随应用的变化而变化的,因此经常出现一种处理器不够用、而另一种处理器闲置的情况,这就限制了高性能运算技术的发展。让原本只做3D渲染的GPU技术通用化,有重大战略意义。
通过CUDA(Compute Unified Device
Architecture)技术,英伟达给GPU装备了一组完全相同的、具有较强编程能力的内核,根据任务情况在顶点和片元处理任务之间动态分配。从G80开始,英伟达GPU体系结构已经全面支持通用编程,同时英伟达也推出了CUDA编程技术,为GPU通用程序设计提供了第一套完整工具。
在软件层面,英伟达面向GPU开发的应用软件接口CUDA经久不衰,CUDA整套软件非常完善,与自家GPU自然适配,能快速搭建神经网络加速软件框架,所以CUDA在早期被很多厂家用于神经网络加速,这也为其打造AI计算平台奠定了基础。另外一个层面,除了CUDA,其他厂家的API也可以在英伟达的GPU上用于神经网络加速,应用程序也越来越多。
英伟达也通过多种方式鼓励高校和研究所从事CUDA相关研究工作,设立CUDA研发中心,发CUDA大师证书,做CUDA技术认证,让学术界为CUDA背书,通过学术界为工业界做预研,通过学术界为工业界培养人才。

英伟达将人工智能领域的优势拓展到智能驾驶领域并拥有近十年的探索经验。GPU的并行架构适合人工智能领域的计算需求,英伟达敏锐的抓住这个特点,成为人工智能芯片及软件工具链的主要供货商。在进行人工智能领域探索时,英伟达开始涉足智能驾驶及机器人业务,并在该领域拥有近十年的开发经验。
硬件优势在于——GPU架构兼顾效率与通用性:效率高于CPU,通用性强于ASIC;设计壁垒高,垄断性强;用户基数保证规模效应:与其他业务平摊研发成本,版本迭代快,持续保证性能优势;端到端的解决方案:车端到云端训练基于同样架构。
软件(工具链)优势——开放平台模式:客户可进行算法自研;软件工具链丰富:开发了全套软件工具链(公司软件工程师占比超过70%),不仅通过软件开发推动硬件的优化设计,还给用户提供丰富的示例与教程,帮助用户快速上手使用。
拓展嵌入式移动芯片到汽车领域

英伟达专注提供高性能服务,借助嵌入式移动芯片,拓展汽车市场。在智能手机兴起的2008年时,英伟达试图进入移动芯片市场。为此,公司开发了Tegra系列芯片,采用了ARM的CPU架构,并集成了自家的GPU芯片,组成了一套SOC系统。
早期的Tegra芯片注重功耗及效率的表现,主要用在微软的一款MP3和Kin手机、小米3手机上,但后由于基带问题逐渐退出手机市场;后期则更专注于提供高性能,其典型产品是任天堂的Switch,英伟达的Tegra X1给任天堂Switch带来了极高的画面体验。由于自动驾驶中对于画面的实时处理要求很高,因此后续的Xavier以及Orin系列也开发了相应的车规级芯片。从移动芯片的发展轨迹来看,英伟达的CUDA核心数量也快速增长,RAM的容量和带宽也迅速提高,移动芯片的性能始终保持竞争优势。
自动驾驶芯片
从2015年开始,英伟达开始进入车载SoC和车载计算平台领域,为自动驾驶提供基础计算能力。
此后英伟达几乎每隔两年发布一款车规级SoC芯片,且不断拉升算力水平。2020年,Xavier芯片算力为30TOPS,2022年发布的Orin算力为254 TOPS,2022秋季GTC大会上发布了新自动驾驶芯片Thor,算力为2000TFLOPS@FP8、4000TOPS@INT8,取代了之前发布的算力达1000TOPS的Altan。

自动驾驶平台
自2015年开始,英伟达已经推出4代自动驾驶计算平台分别为:DrivePX、DrivePX2、Drive AGX Xavier/Pegasus、Drive AGX Orin。
2022年GTC大会上英伟达公布了公司新一代汽车自动驾驶技术平台Drive Hyperion 9,英伟达将Hyperion 9自动驾驶平台比作中枢神经系统,相比于Hyperion 8,其支持感知硬件数量大幅度提升,其中包括,车外部分14个摄像头、9个毫米波雷达、3个激光雷达以及20个超声传感器,以及车内部分的3个摄像头以及1个毫米波雷达。据悉,搭载Hyperion的车辆将能达到L4级自动驾驶能力。Hyperion 9自动驾驶平台的交付时间预计在2026年。

英伟达汽车业务已形成强大开放生态,Tier1,Sensor厂商、软件厂商、模拟厂商与英伟达深度合作。
未来6年在手订单超110亿美元,来自OEM、新能源车企、智能卡车、Robotaxi。英伟达积极布局汽车领域上下游合作,合作形式包括芯片售卖、提供整体解决方案以及授权等。英伟达芯片的使用成本仍然较高。虽然英伟达拥有完善的开发工具链,但针对汽车做适配和算法开发仍然需要大规模的研发投入与单片芯片的几百美元的购买成本相比,企业要投入的研发成本以及合作授权费用才是大头。
▍英特尔Mobileye:EyeQ系列发展历程
2004年4月,EyeQ1开始生产,随后公司收获多轮融资,将商业模式转向汽车安全,陆续与大陆、意法半导体、麦格纳、电装、德尔福等全球顶级零部件供应商签署合作协议。2007年,宝马、通用和沃尔沃成为首批配装Mobileye芯片的车企,Mobileye产品正式商用。2008年,Mobileye对外发布EyeQ2,公司进入稳定发展期。2013年,Mobileye累计卖出产品突破100万台,随后出货量呈现爆发式增长。2017年3月,Mobileye被芯片巨头英特尔以153亿美元的价格收购。

Mobileye在2022年推出了新型EyeQ Ultra,它专为自动驾驶而生。据Mobileye称,EyeQ Ultra采用5nm工艺,将10个EyeQ5的处理能力集成在一个封装中。但是其芯片的计算能力似乎略逊色于英伟达,EyeQ Ultra芯片具有170TOPS,包括12个RISC内核、256 gigaflops、许多GPU和加速器内核等等,功耗不到100W,可以“处理4级(L4)自动驾驶的所有需求和应用”,而无需将多个系统集成在一起的计算能力和成本,解决两个行业面临的重大挑战。EyeQ Ultra预计将在2025年全面投产。
Mobileye还还推出了其最新一代芯片EyeQ6:EyeQ6L和EyeQ6H,采用7nm工艺,能用于ADAS L2,预计将于2023年年中开始生产。该芯片已与大众和福特就地图技术达成扩展协议,以及与吉利达成新协议,到2024年推出全电动L4级自动化汽车。
▍特斯拉:自动驾驶芯片发展之路
Tesla经历了外购主控芯片到自研的道路。2014年-2016年,Tesla配备的是基于Mobileye EyeQ3芯片的AutoPilot HW1.0计算平台,车上包含1个前摄像头+1个毫米波雷达+12个超声波雷达。2016年-2019年,Tesla采用基于英伟达的DRIVE PX 2 AI计算平台的AutoPilot HW2.0和后续的AutoPilot HW2.5,包含8个摄像头+1个毫米波雷达+12超声波雷达。
2017年开始Tesla开始启动自研主控芯片,尤其是主控芯片中的神经网络算法和AI处理单元全部自己完成。2019年4月,AutoPilot HW3.0平台搭载了Tesla FSD自研版本的主控芯片,这款自动驾驶主控芯片拥有高达60亿的晶体管,每秒可完成144万亿次的计算,能同时处理每秒2300帧的图像。

特斯拉为什么自研芯片
类比苹果:苹果采用了自研的A系列芯片,匹配了iOS系统,和其他诸多手机相比,苹果手机的软件流畅性、硬件能耗等相对更胜一筹。
软硬件融合:芯片算力固然很重要,但在英伟达、Mobileye这样的通用平台上,相关的主机厂、自动驾驶公司并不一定有技术水平让硬件发挥到100%,而自研芯片能够在研发阶段更好地让软硬件融合、调整,充分发挥软、硬件的潜力。能对核心硬件有更强的掌控力,在硬件加速上形成差异,更有可能建立起自动驾驶技术的优势。
议价能力:整车厂商只有拥有了技术储备才会有议价能力,在自动驾驶数据处理单元技术上,Autopilot3.0硬件的诞生增强了特斯拉在该领域的议价能力。这或许也是特斯拉自研芯片的初衷之一。
成本控制:DrivePX2功耗为250W,而价格则直接是1.5万美元。如果特斯拉选择自己造自动驾驶芯片,那么成规模之后,有助于降低成本。
提高灵活性:芯片产商的厂商的芯片为了满足通用性,开发周期通常比较长,难以满足需求,而自己开发的话,开发周期可以自主把握,算力需求可以自行设计,无关的通用性接口或者单元可以舍弃,灵活性很高,开发周期更短,功耗也更低。
实现芯片自给自足:在缺芯的环境下,自主设计自动驾驶芯片可以解决在自动驾驶领域的芯片自给自足问题。
特斯拉芯片自研是一条难以复制的技术路线
各类顶级芯片研发人员聚集,为特斯拉芯片自研奠定基础:2016年1月,Tesla从AMD挖来传奇芯片架构师Jim Keller,任命他为Autopilot硬件工程副总裁。2016年2月,Tesla又从Apple招到了研发总监Pete Bannon,Pete是A5芯片核心的设计工程师,在那之前他是PA Semi的架构与验证副总裁。同时期,同样来自AMD的谷俊丽,在Autopilot硬件工程团队下开始组建机器学习小组,这个小组有两个任务:一个是搭建第二代自动驾驶硬件上的AI算法和机器学习软件,另一个是参与设计FSD芯片的架构和上面的软件。
采用以深度神经网络为主的人工智能模型,再加上车端收集的大量数据,特拉斯ADAS水平迅速提升:基于全新深度神经网络的视觉处理工具TeslaVision是Autopilot团队抛开Mobileye、从零搭建的一套视觉处理工具,它的背后,是全新的底层软件技术架构和云端大数据基础设施。Tesla Vision能够对行车环境进行专业的解构分析,相比传统视觉处理技术可靠性更高;借助Tesla售出的车辆搜集的大量数据,反过来又可以对Tesla Vision的神经网络进行训练和改进,进一步优化Autopilot。
除车端芯片FSD的研发外,特斯拉也开始涉足云端训练芯片,试图打通车云系统。从算力来看,其1.09EFLOPS的算力水平和Nvidia用4096块A100构建的集群(1.28 EFLOPS);Huawei用4096块Ascend 910构建的集群(1.05 EFLOPS);Google用3456块TPUv4构建的集群(0.95 EFLOPS)相比,已经不相上下。其对称式的设计理念,可能给超算领域带来全新技术路线的可能性。
特斯拉的芯片自研的成功,竞争对手的可复制性很弱,主要原因有:
(1)芯片顶级研发人才很难被车企所招聘,特斯拉有很大程度是因为马斯克的个人魅力因素,才说服顶级芯片研发人员加入;
(2)自研芯片风险极高,前期投入较大;
(3)如果不能保证使用的数量,则自研芯片性价比很低。
因此,对于绝大多数车企来讲,外购芯片才是更好的解决方案。
特斯拉的FSD芯片
从算法需求倒推芯片架构,软硬件一体化实现高效算力。FSD芯片从算法需求出发,进行了芯片架构设计。其核心技术来源于由两颗NPU组成的NNA(Neural Network Accelerator,神经网络加速单元)系统。FSD芯片于2019年正式流片,代工厂为三星,采用14nm工艺,整个芯片约有60亿颗晶体管组成。

特斯拉的NNA核心体现了成本和功耗的优化
NPU具备强大运算能力。在每个计算周期,NPU都会从内置的32MB SRAM中读取256字节的激活数据和另外128字节的权重数据组合在一起进入乘法累加(MAC),每个NPU都有一个96x96MAC阵列。在完成了MAC的乘法累加运算后,数据将会被转移到激活(Activations)以及池化(Pooling)部分,并等待写入缓冲区汇总结果。
Tesla对于NNA的功耗和成本优化也做了不少的努力。NNA设计了非常大的片上SRAM缓存,相较于Google的TPU,采用了256×256的MAC,只有24MB的SRAM。对于这种特殊的设计,Tesla解释这样做是为了让数据尽可能地在片内周转,而不用频繁地与内存或者其他模块进行读写操作。这样做不但可以提高性能,还可以有效降低功耗。
Tesla在NNA的设计中还偏向于将硬件简化,并复杂化软件,这样做可以降低芯片成本。
特斯拉自动驾驶硬件成本估算:特斯拉自动驾驶域的芯片成本约为5000元,加上外围电路板以及组装、测试成本(组装厂为中国台湾广达集团),预估总体成本约为8000人民币,如果以特斯拉的毛利率计算,假设Model 3的成本为22.9万元,那么自动驾驶域的成本占特斯拉整车成本约为3.5%。
▍地平线:车规级芯片发展历程
自2015年创立以来,地平线仅用了5年的时间即实现了车规AI芯片的量产落地,开启国产车规级AI芯片的前装量产元年。与此相比,Mobileye的车规芯片从研发到正式商用历时8年;作为全球通用AI芯片龙头的英伟达,在CUDA发布后9年才将K1芯片应用于奥迪A8的车用系统。
地平线首款芯片征程1发布于2017年12月;征程2发布于2019年8月,可提供超过4TOPS的等效算力;征程3算力为5TOPS,发布于2020年9月;征程5发布于2021年7月,算力128TOPS。地平线的第三代车规级产品征程5兼具大算力和高性能,支持16路摄像头感知计算,能够支持自动驾驶所需要的多传感器融合、预测和规划控制等需求。
征程5是地平线第三代车规级产品,也是国内首颗遵循ISO 26262功能安全认证流程开发,并通过ASIL-B认证的车载智能芯片;基于最新的地平线BPU®贝叶斯架构设计,可提供高达128TOPS算力。
2022年4月21日,比亚迪与地平线正式宣布达成定点合作,比亚迪将在其部分车型上搭载地平线高性能、大算力自动驾驶芯片征程5,打造更具竞争力的行泊一体方案,实现高等级自动驾驶功能。按照计划,搭载地平线征程5的比亚迪车型最早将于2023年中上市。2022年9月30日,理想L8搭载征程5全球首发上市。从研发到正式量产上车,征程5芯片仅用了近三年的时间,同样刷新了高性能智能驾驶芯片的应用效率。除了比亚迪、理想L8之外,征程5也已获得上汽集团、一汽红旗、自游家汽车等多家车企的量产定点合作,更多合作车型将陆续量产发布。
▍华为:MDC智能驾驶计算平台
华为于2018年10月首次发布智能驾驶计算平台,支持L3的MDC600、支持L4的MDC300;2020年9月发布支持L2+的MDC210、支持L3-L4的MDC610。MDC610正在洽谈搭载的车型有广汽埃安AION LX、长城沙龙机甲龙、广汽传祺。2021年4月发布支持L4-L5的MDC810,首搭于北汽极狐阿尔法S华为HI版,正在洽谈搭载于2022年哪吒TA、广汽埃安;并计划2022年推出MDC100。
Ascend芯片
华为MDC所采用的Ascend系列芯片,主要有Ascend310和升级版Ascend910两款芯片。
Ascend包括训练和推理芯片,用于训练的Ascend910,半精度(FP16)算力达256TFLOPS,是业界的2倍。用于推理的Ascend310,整型(INT8)算力16TOPS,功耗仅8W。
作为一款AI芯片,Ascend310的一大亮点就是采用了达芬奇架构(Da Vinci)。达芬奇架构采用3D Cube,针对矩阵运算做加速,大幅提升单位功耗下的AI算力,每个AI Core可以在一个时钟周期内实现4096个MAC操作,相比传统的CPU和GPU可实现数量级的提升。
▍黑芝麻智能
黑芝麻系列芯片产品包括华山一号A500、华山二号A1000、A1000L、A1000Pro、A2000。2019年8月,黑芝麻智能发布了华山一号自动驾驶芯片A500,算力5-10TOPS;2020年6月,黑芝麻智能发布华山二号A1000,算力在40-70TOPS,低配版A1000L在16TOPS,高配版A1000Pro则在2021年4月发布,算力达到196TOPS。华山二号A2000是国内首个250T大算力芯片:顶尖7纳米工艺、国产自主知识产权核心IP、满足ASILB级别的安全认证标准。
黑芝麻华山二号A1000系列芯片已完成所有车规级认证,已经与上汽通用五菱、江淮等内的多家车企达成量产合作。在黑芝麻最强芯片华山二号A1000 Pro中,搭载了黑芝麻自研的图像处理器和神经网络加速器。其中,神经网络加速器能够让A1000 Pro芯片的INT8算力达到106TOPS,INT4算力达到196TOPS。
▍芯驰科技
从2019年到2020年,芯驰科技先后发布了V9L/F和V9T自动驾驶芯片,分别可支持ADAS(高级驾驶辅助系统)以及域控制器。
面向集成度更高的汽车电子电气架构,未来两年芯驰科技还将陆续推出能够满足更高级别自动驾驶的高算力芯片。2022年,芯驰科技计划发布算力在10-200T之间的自动驾驶芯片——V9P/U,该产品拥有更高算力集成,可支持L3级别的自动驾驶。到2023年,芯驰科技将推出具有更高算力的V9S自动驾驶芯片,该芯片面向中央计算平台架构研发,算力高达500-1000T,可支持L4/L5级别的自动驾驶的Robotaxi。
芯驰科技在2021世界人工智能大会上发布了基于V9系列芯片开发的全开放自动驾驶平台——UniDrive。UniDrive的可扩展性非常强,从L1/L2级别ADAS到L4/L5级别的Robotaxi的开发都能支持。
▍芯擎科技
芯擎科技研发的首款7nm智能座舱芯片“龍鷹一号”,已于2021年6月流片成功,对标高通8155芯片。并且“龍鷹一号”即将于2022年底前实现量产上车,目前针对量产车型的各项测试和验证工作已陆续完成。
芯擎科技计划2022流片的自动驾驶芯片AD1000,将满足L2+至L5级自动驾驶需求。未来芯擎科技会在自动驾驶领域不断深耕和探索,并且对标最先进的产品。具体来说,仍会采用7nm制程,将具备更高的算力和安全性。
▍国内企业如何破局
市场还未固化,需求和技术路线仍在探索:目前国内自动驾驶芯片虽然与英伟达等厂商还存在差距,不过从地平线、黑芝麻智能等不断推出的新品来看,芯片算力在持续提升,另外,对于自动驾驶芯片来说,算力并不是唯一标准,效率、软硬结合也很重要。此外,中国自动驾驶芯片除了在质量上不断提升之外,还需要更多的考虑和解决规模量产的问题。
芯片半导体依然是国内资本青睐的领域:无论是国家政策,还是投入的资源,现在的中国自上而下都会优先确保芯片所需的各种资源。根据公开数据显示,在过去的两年里,国内芯片半导体领域的年均融资规模都超过了2000亿元,而2022年上半年也有超过800亿元的融资额。像地平线、黑芝麻智能这样的公司,已经被视为英伟达、Mobileye这样深耕自动驾驶芯片公司的国内替代技术方案。
国内车企的崛起有望推动产业转移:比亚迪2022年三季度净利润近百亿元,同比增长三倍不只是比亚迪,以比亚迪为代表的的国内车企正在崛起,国内像蔚来、小鹏汽车和理想汽车,均在大力发展自动驾驶技术。
参考文献链接
https://mp.weixin.qq.com/s/hzwdmWowoXMzaIQ0FhM1mg
https://mp.weixin.qq.com/s/s9bq6Gh92x367Y-B9JuVww


图片来源:毫末智行







浙公网安备 33010602011771号