• 采购项目
  • 配套企业库
  • 销量查询
  • 盖世汽车社区
  • 盖世大学堂
  • 盖亚系统
  • 盖世汽车APP
  • Gasgoo night
  • 盖世汽车产业大数据
  • 2025汽车消费趋势洞察大会
  • dive into the Chinese auto market and supply chain
  • 2025第三届中国汽车及零部件出海高峰论坛
  • 第八届上海-斯图加特汽车及动力系统国际研讨会
  • 2025第四届中国车联网安全大会
当前位置:首页 > 智能网联 > 正文

【2019世界车联网大会】地平线多模交互产品总经理张宏志:AI芯片赋能座舱智能化

盖世直播 2019-12-05 09:26:34
核心提示:以前看一款芯片的时候,更多的是看单位面积的计算能力,而现在则是先讲场景,再谈应用。

【2019世界车联网大会】地平线多模交互产品总经理张宏志:AI芯片赋能座舱智能化

地平线多模交互产品总经理 张宏志

我们看车的发展的时候,肯定的是一个物理世界和一个数字世界演变过程。因为数字世界更多的是积极、主动的来服务人。现在有两个非常大的驱动力,一个是AI技术,另外一个是互联互通5G技术,它所形成的典型特征,我们身边很多的设备,更多的能够在边缘计算上把很多的数据计算清楚,并且把它快速的传播开来。因为本质来讲,数据量小一点,传播的通道大一点,所有的数据交互会更快,这样所形成的数字社会会更加丰富化。

绕不开的定律是摩尔定律,这个是过去几十年来,每隔18个月,身边所感受到的电子设备计算能力的指数级的飙升,这个定律一直走到现在。但是比较典型的是2015年以后,随着工艺逼近物理的极限,接近于原子级别,通过制造工艺来提升性能已无法获得大的突破。继续推进摩尔定律,典型的方向是把软件设计和硬件设计结合在一起来整体推动性能提升。从这一点来讲,地平线就是走在这条路上的一个公司,把场景、软件、硬件结合在一起设计的AI公司。

刚才讲到要关注的是无人驾驶场景,智能座舱场景,关注软件和算法。中国有几个特别的优势,典型的是数据,还有行业的应用,还有快速的技术普及所带来的市场机会。典型的像我们看到的移动互联网,020等的发展,完全验证了中国这个市场带有极强的特色。那么结合刚才新的技术解决方案落地,在AI芯片计算基础科学领域,中国有一些自己独有的机会。

在我们看来,计算平台的发展,以前看一个芯片的时候,更多的是看单位面积的计算能力,但是到现在来讲,看到计算单元的时候,先被问到的问题是,这份芯片是用在什么场景,比如说自动驾驶用到的芯片,或者是智能座舱芯片,永远先讲场景。之后是应用,支持不支持Adaptive?之后是用什么样的硬件,什么样的芯片来解决这个问题。

所以这种情况下,我们更多时候是软件工程师来选择硬件,而不是说硬件先行,做出来的电子电气架构已经框在这里,软件工程师你们自己在上面做。

在过去的4年中,地平线把场景还有应用、算法,包括芯片结合在一起,我们做出了中国第一款的车规级芯片,2W的功耗,供大家使用。

不管是产品理念,行业需求,还有技术,芯片处理来讲,典型的一点是把车内的座舱原来是功能类的演变成一种交互类的,也就是像刚才哈曼的林总讲的,原来是一个物理式的按纽,现在是一个很好的显示界面放在上面,大家越来越追求舒服、体验。

另外一个角度来讲,不管是作为Tier1还是Tier2,大家越来越普遍的观点:大家通过同一个产品来看待汽车,在产品设计角度没有一个很清晰的甲方乙方的边界,更多的时候被大家讨论的问题是,提供给用户的是什么。

从这一点来讲,这几年从互联网公司发展、车企发展角度来看,都在努力将技术转化为对普通消费、普通用户而言非常好的体验和感性的价值。我们可以看到,在未来人对于体验,对于感受,特别是随着自动驾驶越来越把人从驾驶的行为上解放出来的时候,人会处于一个更加私密性的空间。

那么在一个私密性的空间里,人对于交互会有更高的期待,因为人在一个私密空间里,不管是在家里还是沙发里,人典型的特征会出来,一个是特别懒惰,另外一个是不愿意去思考。你在家里是一个完全私人的空间里,人会变得偏懒惰。

那么在这种情况下,就会对于更加智能化的座舱,更加智能化的体验有强烈需求,会希望车是一个和自己相关、关联性更强的东西。比如我不喜欢什么颜色,喜欢什么颜色,完全是个人爱好的,但是对不起,可能由于我不太喜欢某一种颜色,从一开始接触到的颜色,是让我强烈反感的,就和这款车说拜拜了。

人在思考上的懒惰,并不会让人更加主动、积极的去表达我想要什么,我想这辆车怎么样的时候,更多的心理预期是反过来的,我买了这个物体,这个机器应该更多的是反过来为我而思考,这一点,是人天然的思维活动所形成的,人一直把自己标榜成万物的灵长。

从技术的角度来讲,从感知到融合,到路径规划、控制,AI发展,由无人驾驶所驱动出来的技术路径,所形成的技术沉淀,对于智能座舱影响非常明显。从感知层面来讲,更加精准的感知,包括图像类的感知,语音类的感知,更加精准,更加精细,更加丰富,能够使这辆车联网和云端所形成的推荐体系、个性化体系结合在一起,呈现出来一种主动化的表现。

地平线是一家芯片公司,是一家把场景、算法、芯片放在一起综合设计的公司。那么在过去4年中,我们把芯片、语音算法,包括语音和视觉放在一起进行融合,所产生的感知结果做了一套方案给大家来用。这里典型的是高噪声情况下的语音唤醒和命令词的识别,需要更多的传感数据融合产生结果。因为在噪声情况下,并不能够把语音识别做的很准。但是在这里只要加入唇语,嘴唇讲话时的波型放进去作为参考可以很好的提高这一点,并且由于终端测算力增强,还有信号增多以后,可以提到上百个词,并且准确率并不会下降。

另外,像声纹识别,性别,包括年龄,情绪,这一类的识别来讲,单纯的通过图像、语音得出来的效果,其实都有非常大的波动,非常难以给出让人满意的结果,典型的是小鲜肉的现象,非常容易呈现出来是偏向于中性化特色的。但是实际上他心里的体验预期是一个男性化的体验。

地平线在过去四年,不仅仅做了研发,还做了落地,AI技术和芯片在落地方面是非常艰难的一件事。因为整个行业的认知、理解能力,是需要整体性去提高,大家才能做到刚才前面讲的,满足最终用户的需求。当我们看到一个行业的挑战的时候,会说:OK,想要一个场景,想做什么样的软件,需要什么样的算法,只要在一个硬件上,把雷达、摄像头、麦克风放上去,选一份芯片就好了。

反过来看到这一点,从下面往上面去推,我的芯片需要支持什么样的神经网络,什么样的工具链,需要把算力优化到什么程度,才能满足这一点。这一点很有意思,我们每次看到一个场景,看到一个应用的时候,都会非常习惯性的自然而然的形成芯片的计算资源,它不是瓶颈,包括我们看到很多的芯片,几个T算力的时候,但是忽略了它的计算利用率。在当前这个情况下,要求把图像做到40帧/秒的时候,利用率没那么高,最后会让你觉得不得不砍掉这个功能。

还需要考虑到图像和语音的通道问题,硬件设计,比如说两个异构数据,本身传输到芯片时候频率又是不一样,多个摄像头传输到同一块计算单元的时候,有延迟,需要花很大的精力去解决它。之后需要非常复杂数据训练、标注等,反复枯燥的去折腾。

最后把这些折腾完,把网连上,最后完成一个智能化的场景。有可能是我在车里面抽烟,然后在没有下雨的时候,把窗户打开。要考虑我在左面抽烟和右面抽烟的差别。而某一天在下雨的时候,没有打开窗户,只是办了一件事,打开了空调,把空气净化掉,可能最后想做到的场景就是这么一个一点点智能化体验的提高,但是要从头到尾、从下到上反复的折腾两遍,一边是需求,到整个的定义,另外一个是整个研发。这一点的难度,造成AI在行业落地的时候,特别缓慢。

对于地平线来讲,定位为Tier2,把我们的经验、能力贡献出来,包括像长安已经成为我们的客户,我们有一些像首汽,SK这样的客户也用了我们的一些解决方案。地平线基于自己的芯片、算法,推出了自动驾驶计算平台,面向L4的。

另外我们推出了面向L2、L3的视觉感知方案,并且也做了一些面向无人驾驶的感知、激光雷达工作。最后一个是把语音、芯片等结合在一起所形成的解决方案。

为了让AI落地,地平线要保持的是开放,我们要把我们的能力开放给客户,包括提供超高性价比AI芯片,极致的功耗效率,特别是在高温和低温情况下,功耗效率比要足够好。另外是开放的工具链,还有算法模型样例,把这些贡献出来。本质来讲,我们现在处于AI时代,还是刚刚起步的。接下来随着5G、AI芯片发展,速度越来越快,对于计算能力,感知算法需求会爆发式增长,这一点,无论任何一个公司,都不能说是自己公司可以做的完的,肯定是一个生态化合作的,所以说,地平线把自己的经验开放出来。

基于刚才地平线的芯片和场景算法来讲,地平线提供了一套开发工具链——天工开物,除了芯片相关,包括训练平台,包括一些数据,包括一些地平线所形成的最佳的实践,AI算法训练等。

(本文来自2019世界车联网大会,根据现场速录整理而成,如有错漏,敬请告知。)

敬请关注盖世汽车2019世界车联网大会”直播专题!

https://m.gasgoo.com/news/topiclive/218

本文地址:https://auto.gasgoo.com/News/2019/12/5I70143921C601.shtml

 
0

好文章,需要你的鼓励