• 采购项目
  • 配套企业库
  • 销量查询
  • 盖世汽车社区
  • 盖世大学堂
  • 盖亚系统
  • 盖世汽车APP
  • 2024第四届汽车智能底盘大会
  • 2024第五届汽车电驱动及关键技术大会
  • 2024第二届中国汽车与CMF设计大会
  • 2024泰国汽车市场深度考察(第二期)
  • 第六届汽车新供应链大会
当前位置:首页 > 新能源 > 正文

【2020电动汽车百人会】长沙智能驾驶研究院马潍:怎么用好自动驾驶的核心技术算力平台

盖世汽车 直播君 2020-01-14 14:09:06
核心提示:“2020电动汽车百人会论坛”嘉宾演讲实录!

1月10-12日,2020中国电动汽车百人会论坛在钓鱼台国宾馆隆重召开。本次论坛围绕“把握形势 聚焦转型 引领创新”主题,邀请政府有关部门和汽车、能源、交通、城市、通讯等领域的行业机构和领先企业代表,就行业、企业、政策的转型与创新展开深度研讨。以下是长沙智能驾驶研究院CEO,马潍在本次论坛上的发言:

【2020电动汽车百人会】长沙智能驾驶研究院马潍:怎么用好自动驾驶的核心技术算力平台

长沙智能驾驶研究院CEO 马潍

非常荣幸。我们是长沙智能驾驶研究院,从事商用车和专用车的智能驾驶的产品开发,完全是按照市场化运作的,我想跟大家分享的是过去几年我们在做自动驾驶有关算力平台这个核心技术的体会,怎么用好算力平台。

目前自动驾驶来到了大规模量产的阶段,我们面临的主要有三大挑战:1.技术的成熟度,我们做演示都不错,但是最后1%能不能解决,因为车99%可能就等于是0,光靠深度学习不够,是一个长尾,很难在短期内形成落地的东西;2.法规的容忍度,即便技术成熟了,法规是不是允许在公开路上跑;3.成本的接受度,若超出客户的接受能力,也落不了地。几年前激光雷达还是很贵的。

自动驾驶使得车载系统的复杂度提高了100倍,效率就形成了核心竞争力,是不是有方法能够高效地解破复杂系统,迅速地把产品做出来?我们的观点是这样的:智能驾驶虽然看起来非常有挑战性,但是很多落地的机会就在眼前。为什么叫智能驾驶,不叫无人驾驶和自动驾驶?因为我们认为智能驾驶可以是无人驾驶,也可以是有人驾驶。有四个方式:1.导弹模式,像导弹一样设个目标,就不管了;2.无人机模式,无人化、矿山,需要的是无人化,不要出事故,但是人可以远程驾驶,就像遥控无人机一样;3.飞行员模式,像特斯拉的模式,人在车里像飞行员一样,虽然飞机可以自动驾驶,还是有两个飞行员;4.辅助驾驶,就是司机模式。落地在一些具体的环境下,矿山、码头是最好的,我们也认为矿山是第一个无人驾驶的落地场景。

但是现在主流的在做RoboTaxi,有大量的公司在做,至于怎么解决最后1%?持续的投入是必须的,数据采集,但是我们认为短平快的方式大批量落地,应该从路上解决,车路协同,我们产品已经量产,车路协同可以解决一些感知死角,盲点,达到超视距,超视角,再利用利用低延时的通信协议指挥和车辆自动驾驶。第二个是远程驾驶,实在不行了,尤其是低速可以逼停,由人工接管,避免最后1%的长尾效应。人机共驾也是一个解决办法。

这是我们公司目前做的智能驾驶的总体的思路,车路协同的自动驾驶,包括,聪明的路,同时也有单车智能,并包括车厢、挂车,包括无人跟车队列和车车协。的,我这儿改了改叫“一路一带”,把每条道路变成智能传送带。

法规目前还有很大的不确定性,是现在中国政府实际上是推动力非常强的。长沙有“双一百”公开道路,允许自动驾驶试验,已经在运行的,很多城市都有,长沙还有7.8公里的公开道路公交线,我们和中车电动合作的有四辆公交车在公开道路上的研究。目前最容易落地的还是非监管的区域,就是不受法规监管的,无人驾驶、无人化的矿山机械设备是一个刚需。

成本的问题牵扯到我今天要分享主题,主要是算力体系架构的问题。成本有很多个层次,一个是绝对成本,比如商用车L2是2万、L3是3万、5万,还是L4 的10万?第二个是相对成本,如果成本下不来,那能不能把自动驾驶设备放在贵重的车上,比如矿卡一个两千万,重卡、危化,高运营里程的费用相对容易落地,从开发者的角度,我们关注的重点就是动态成本,比如OEM做一个车要几年时间,Tier1也要几年,有很多专家今天也在这里,但是我们的芯片,几乎每年大幅度下降,比如激光雷达几年前70万,现在大疆做的激光雷达已经4000块,明年有人可能就做到几百块人民币。作为一个初创公司、技术公司能不能高效地把握住这些开发费用的匹配?如果定型以后,五年以后只能照着走就很难了。

我今天分享一个核心技术,我们认为算力平台是核心技术,不管是成本、难度、复杂度、开发周期和主机厂所希望掌控的都是在这个。自动驾驶所需的算力有各种估计的办法,实际上关键的问题就是我们的算法在不断地有更高的要求,每6个月对算力的需求增长1倍,有效的算力是很重要的,能不能把算法匹配到处理器的架构,比如数据怎么对称、矢量化来做。

自动驾驶的算力现在有很多个TOPS,我分成高算力、中算力、低算力三个等级。有人说既然有高算力就不需要低算力了,只是一个零头,但是不一样,低算力有它的要求,比如它主要在执行上要求绝对可靠,决策规划是中算力,也要求很多的可靠性,有端到端的深度学习也可以用大算力,但是目前大算力主要在环境感知上,各种各样的感知需要很大的算力。

自动驾驶嵌入式计算平台是目前非常复杂的系统,特点是并行,多核、多单元、高粒度,各种维度、异构,CPU、DSP、GPU、NPU、ISP、FPGA,有超长指令、可变指令、短指令+微码等等,字长也是多种多样的,目前理论的算法都是8bit×8bit,你的算法很难保证都是8bit×8bit的峰值算力。另外存储器也存在瓶颈,尽管装了很多的运算单元,喂不进去数据怎么办?这里头比较经典的是存算一体化,iRAM是伯克利大学的一个教授九几年提出来的,实现了很多次都不成功,现在很多人都在做。当一个芯片中有大量的处理单元,上万个,实际上应该是以存储器为主的一种设计方式了,不应该再以中央处理器CPU为主了。

我大概分组了一下,现在也很难分,都是很混合的。一种这边看,左手边是以连接型的,最早是片上总线,FPGA是很典型的。还有计算型,目前混合型的比较常见,手机芯片中用得很多,我下面罗列了一下, 时间关系,这里就不仔细讲了。

目前用得最多的低算力芯片是英飞凌的,高可靠、低算力,算力并不高,300兆,但是一组三个芯片,互相冗余。这个是两组6个芯片,跑同样的程序,是确保有足够多的冗余。中算力举了一个例子,是NXP的,这里头有处理器、有多核心的,有各种各样的加速器,和的处理器。Mobileye是最有名的英特尔的,EyeQ5现在24TOPS,马上过两年要出EyeQ6,等于是120多个TOPS。

我们在过去几年很多芯片都用过,比如海思3559A是非常好的芯片,功耗也比较低,监控用得比较多。实际上它是系统芯片,包含高、中、低三种算力,单片都实现了,8TOPS,但是很显然这里头的,比如DSP用的是Cadence vision,Cadence vision是可变指令,一个就有256个乘加单元,就是卷积运算的基本单元。vision Q7也可以高达1.87TOPS,四个加起来也不少。

TI在CES刚宣布的Jacinto7是完整的车规级的芯片,包括高、中、低三个算力,包括可靠的控制算力,包括有用计算,给用户作为编程用的,还有各种各样的加速器。 DSP C6x 和 c7x 系列,这个芯片有20个TOPS。这些芯片,尤其半导体厂商大规模介入,成本也是由原来的几万块、几千块,现在可能到几百块人民币的样子。实际上能不能用好算力芯片,迅速地把有效算力用上去上去、,我们认为实际上是目前一个非常难的问题。

英伟达是目前用得最多的,它的好处是好用,系列非常丰富,而且每一个之间的变化实际上都是可以很容易地移植过去。我们用的Xavier,我们非常期待Xavier NX,TX2我们也用、Orin刚发布,高达200TOPS各种各样的用法。所以对于我们一个做专用车、商用车、作业车,我们面临的选择是很多,比如我们做车路协同,今年我们卖了一千多套系统,包括通信系统和边缘计算,它的要求也不一定是非要车规级的,但是根据你的感知配置,实际上算力要求是不一样的。

英伟达的主处理器Denver处理器,Run-time的超长指令系统,实际上在整个运行过程中可以优化,这些都是比较复杂的。

最近我们讲特斯拉,特斯拉原来用Mobileye,后来用英伟达,最近自己做芯片,这个芯片单片就已经很高的运算能力,有36TOPS,一个盒子144TOPS,实际上是有4个芯片。这个加速单元有将近1万个乘加单元,就是卷积运算的基本单元。你想有1万个,华为有立体的输入,怎么把数据喂进去是非常难的,如果数据不是矢量化的,指令怎么控制?这是非常困难的,它的功耗也非常低。

从Tier1的角度做一些固定的盒子,如果不是单片也不要紧,如果能够把各种片子放在一个盒子里给开发者也提供了很大的方便。早期NXP的蓝盒,比如地平线的也是利用它的等效算力,也是4TOPS,尤其是在成本上极具竞争力。我们现在和华为用的也是它的MDC,MDC600的有效算力352万亿次,刚才我说的一千万亿次的算力实际上是很快做到的,现在英伟达下一款芯片就是一个单片200万亿次,量都非常大。

这是简单的比较,比如英伟达的Pegasus是320万亿次,有4款大片,特斯拉的HW3.0,144TOPS,非常复杂,这里的主要特点是放了很多SRAM,就是以存代算,虽然不叫存算一体,但是能够大幅度提高运算的有效性。华为的MDC600目前是总算力最高的,里头有昇腾、有鲲鹏,也有海思的处理器。

虽然峰值算力很高,但都是8bit×8bit字长,如何把有效算力提出来?很多盒子拿来以后,最后有效算力就10%,能不能提高到90%以上?能不能在算子上做工作?我们提出了一个方法,层次化的迭代,就是能够确保验证,描述算法不断地在高级语言的层次上迭代到有效算力能够提高若干倍,起码2倍以上,有效算力提高以后,实际上竞争力、成本都是达到比较有效的利用。

可靠性我就不讲了,有各种冗余。特斯拉也是装了四款芯片,Moblileye最近说6个芯片来做RoboTaxi的解决方案,单片就是24TOPS。嵌入式的实现我们是按照Autosar的方式,我们的整体软件是L2到L5的平滑演进,这里不讲了,虽然软件要和硬件独立,但是并不等于低层的算子库不能优化,一定要优化,不优化有效算力提不出来的。

最后我简单介绍一下我们公司,我们公司目前有300人,我们主要讲的是靠方法论,以效率制胜。我们成立两年多,是完全市场化运作的研究院有限公司,红杉领投的,创始人是大疆原来的董事长李泽湘教授。

我今天就分享这些,谢谢大家!

敬请关注【盖世直播】中国电动汽车百人会论坛(2020)
https://m.gasgoo.com/news/topic/223
提示:本文根据发言整理,未经专家审核,请勿转载。

*版权声明:本文为盖世汽车原创文章,如欲转载请遵守 转载说明 相关规定。违反转载说明者,盖世汽车将依法追究其法律责任!

本文地址:https://auto.gasgoo.com/news/202001/14I70151623C501.shtml

 
0

好文章,需要你的鼓励

微信扫一扫分享该文章