• 采购项目
  • 配套企业库
  • 销量查询
  • 盖世汽车社区
  • 盖世大学堂
  • 盖亚系统
  • 盖世汽车APP
  • 问界M7核心零部件配套供应商一览
  • 2024中国汽车低碳与可持续发展论坛
  • 2024智能座舱车载声学大会
  • 2024第六届智能驾驶地图与定位大会
  • 2024第七届智能驾驶与人机共驾论坛
  • 2024第二届吉利汽车技术论坛暨前瞻技术展
当前位置:首页 > 高端访谈 > 正文

思必驰CMO龙梦竹:从安全出发 打造新一代车载对话交互系统

盖世汽车综合 2019-02-21 17:03:20

2月20-21日,2019全球第二届自动驾驶论坛在武汉举办,本次论坛以“智能驾驶 改变未来”为主题。思必驰CMO龙梦竹发表了主题演讲,演讲内容如下:

思必驰CMO龙梦竹:从安全出发 打造新一代车载对话交互系统

思必驰CMO 龙梦竹

大家好,我来自思必驰。其实我们在最近一年里面,基本没有在车圈里面做过任何的发声,因为我们在做一个新的更安全的智能车载语音交互的系统。在今年1月4号的时候,思必驰正式发布了芯片,同时也把我们新的车载系统公布于众,今天其实是我们新的车载智能语音交互系统的第一次正式的、详细的介绍。

先谈语音交互,不用再跟大家讲很多基础的背景信息了,我们就谈语音交互的终极使命到底是为了什么?我们说语音交互是未来人机交互的入口,是能够做家居的控制,做联控,做语音识别,做后面的内容服务,那么它的终极使命到底是什么? 

在不同的场景下,语音交互的中心使命一定是不一样的,以现在语音交互的比较多的四个场景而言,在家居的场景下,语音交互的终极使命是为了方便。所以我们在家居里面不管是音箱、电视甚至一些小的模块,会更多地考虑远场的交互,因为解决的第一个方面的问题是距离的问题、操控的问题。在玩具里面语音是刚需,因为它是交互沟通,能满足沟通的需求,我们现在定义智能机器人跟玩具的核心区别在于这个玩具能不能交互,能不能沟通。那么在我们熟悉的汽车场景里面,我们认为语音交互满足的刚需是安全,思必驰从2014年开始做车载语音到现在我们对整个内容开始在收紧,对安全性的要求开始在提高。

我记得在去年跟某一个主机厂聊天,他问现在语音能不能直接控制车窗,在前年年底还是去年初的时候,我当时是这么回答的,我说语音在车载的环境下做车窗控制、车速控制、座椅控制也好,都没问题,但核心是语音识别现在没有任何一家敢保证说我的准确度能到达百分之百,但凡没有百分之百,哪怕你99.99%,一旦语音交互在车载的场景下发生了识别问题、交互错误,后续的安全隐患谁来买单?所以我们在后来所有的车载语音交互里,考虑最多的其实是安全性的问题。

还有现在比较多的客服也好,企业交互也好,是另外一个维度,在于效率,就是我们所理解的语音交互在不同的场景里面的一个终极使命。回到车载里面来,国内都知道人工智能几十年,语音也发生了几十年,但真正的车载语音交互发展阶段大概可以分成四个维度。把2010年、2015年、2018年作为三条界线,在2010年以前我们可以把它认为是一个基础的能力期,在那个时候我们所做的语音技术服务更多的是单点识别和解析,并且这里的识别大部分是本地的,我们那会谈的是语义解析,不是语义理解。那会还远远到不了我们所谓的感知程度,认知程度,只是简单的一个基础能力期。

在2010年到2015年之间,我们把它叫做识别的提升期,那个时候我们可以做一些简单的联网识别,去做一些简单的NLP和NLU,我其实是在这个阶段进入AI圈子。我记得2014年春节有山东纠正哥的事,当时我作为一个新人,就在想纠正号码理论上应该很简单,不行吗?为什么不行?这个是现在的AI技术吗?这是车载应该有的语音技术吗?但是现在回过头来看,那会儿整个大环境、整个技术的发展也就到了一个提升期而已,还远远到达不了我们现在的阶段,但是那个时候在内容方面开始有了比较大的变化,从最开始的简单的导航,可以做一些简单的音乐的获取,搜索信息服务等等。

正式的发展阶段其实是在2015年到2018年这三年里面,从整个车载的后装、联网、4G、wifi功能的丰富,包括传感器的发展,整个车联网的语音交互系统和技术得到了快速的提升。首先在技术方面,在2016年以后,大家开始关注家居,但其实在2014年2015年,整个AI语音交互技术最开始是从车载尤其是后装市场起来的。因为前装跟后装的需求不一样,前装在做语音的时候,可能会需要3到5年的时间去做一个调研,做一个新的车型规划,而后装不用,语音交互体验就是他们最大的产品卖点。所以他们的消费需求会很新,我们在2015年、2016年的时候每天都有产品在出货,每天都会接到新的来自于行业里面的合作客户对语音交互新的需求。需求会反过来促进整个技术和行业的发展。

在2018年以后又有了明显的变化,我们开始去提倡多模态的人机混合智能,包括如何把车载的场景跟家居场景做联动,在开车的路上我就能控制家里的空调先开着,电视先开着。我们会讲究更多的场景联动,讲究技术上的人机耦合和混合智能概念。在内容方面,我们开始不再满足于导航、音乐、一些票务的咨询,我们有了更多的需求,包括更多的客服需求、个性化推荐需求,声纹对车主的认定需求。这个是我们这几年所看到的,或者说我所看到的整个中国车载语音交互的发展的情况。

对技术而言,在这几个阶段里对技术的重点需求是不一样的。我们可以把现在我们所看到的不管来自于前装、后装还是其他TSP厂商的需求分为三个方面,第一,基础需求最简单的DSP,信号处理的能力,包括识别的能力、合成的能力,我们把它称为基础的需求。我常常会接到很多的客户的询价,说我们需要语音多少钱,我说你以为这个是买大白菜,你要什么我就给你什么,我们的所有时间、周期、难度是根据客户的硬件需求、产品规划、未来的发展而定的。这三个我们把它叫做最基础的。第二,进阶的需求,可以把它叫做认知智能的能力,包括NLP、NLU、NLG还包括后面的对话管理以及技能,所谓的技能就是指单点的语音技术和背后的内容服务去做一个耦合。在2018年以后,我们所接到的更个性化的需求包括像对车主的认定、对性别的判断,对后面个性化推荐内容的判断,所涉及的声纹识别的要求,以及为了打造更多样化、更个性化的产品而提出的所谓的虚拟机器人的概念,我们客户会提出声音IP的概念等。

在整个的车联网语音交互里面,语音交互其实是手段,并不是一个真正的功能,你不能讲我这个设备的优点是因为有语音交互,我觉得那不算,那就是一个必备的交互方式,重要的是背后能够提供什么样的内容,能够满足车主什么样的服务。大家应该见到很多了,都在说我们把车联网下的内容需求进行分类,导航、音乐、电台、听歌、票务、微信、电话等等,但其实还能再细分,我们所看到的只是大面,但实际还有多少?我们在每一个需求的内容下还能根据技术的耦合情况去进行细分和深入垂直。举一个例子,我们拿导航做一个例子,在以前我们觉得只要识别准确就可以了,我说中山公园东门你能给我导过去就行,在用户使用和产品的迭代发展里面,我们发现需求在一直变化和深入,在最开始的基础导航信息里,我们会发现在导航里面有类似于周边服务,有类似于模式的切换,免唤醒,跨领域地打断,偏好设置,路径规划,多地图多途径多地点的设置等等不同的需求,回到我们刚刚所谓的技能方面,我们会把技术跟需求配合内容去做一个对接。

思必驰到底能在这里面做什么?思必驰我们现在所提供的是我们所有的AI语音交互相关的全链路技术,我们的技术会打包成以平台和芯片的方式去进行纯软的全渠道服务对话方式。车联网汽车是我们所有的业务领域中的一个。

我们创立在2007年,过去我们主要做教育,在2014年的时候我们开始转型专攻物联网,2014年到2017年、2018年我们只做三个领域,车载、家居、机器人。所以在2015年的时候,思必驰在车载的后装市场市占率第一。当时比较火的AIOS大家应该还记得,所有用于OS的后视镜跟车机里面的语音95%以上来自于思必驰,我们在车联网的后装拿下了第一,在2017年2018年的时候,我们开始做前装的安排和准备,在家居领域,大家比较火的音箱,现在的小爱同学、天猫精灵一代二代三代、华为音箱、网易音箱背后的技术全部是思必驰。在2017、2018年以后,我们平台开始推了全渠道的服务,我们的业务领域会逐渐扩展,但是家居跟车载仍然是思必驰非常核心的业务方向。

我们作为专业的车载语音技术方,拥有全套的从识别合成到声纹到唤醒到信号处理到口语理解、对话管理、知识图谱、后端的内容服务需求、对话技能等全套的技术服务。在这个里面我只想讲我们现在关于声音IP的能力。如果在座的有在看央视一套的《经典咏流传》,他们今年推了一个新的声音IP线上互动,背后的技术提供方也是我们。思必驰现在拥有十多个标准的TTS模型,我们支持大数据的快速定制,也支持小数据的快速制作。我为什么会讲这个是因为任何一个设备里面需要有一个机器人,任何一台车对车主而言都希望有一个自己的机器人。在这个里面我们能够提供的一个个性化的外在表现就是声音IP。

我们在2014年转型做物联网之后,在2015年推出了AIOS,在2015年、2016年的时候,整个后装基本上都会用到AIOS系统。在2017年的时候,我们推了全链路的智能对话定制平台DUI,之后在DUI的基础上我们推出了现在要给大家介绍的最新的车载语音交互系统,大家会问到底我们的语音交互能到什么情况?这个视频是2016、2017年我在网上看到的很火的一个视频,看到的时候我才发现这是我们客户的。所以这个视频没有特别高清。在2015、2016年推出的AIOS里面思必驰已经率先完成了像自定义唤醒词、跨领域打断、导航以及周边查询、音乐中的快捷交互等等11个功能。

我们AIOS是针对于后装的,如果这套系统放到前装市场里面,其实并不是那么通用,所以在2017年我们推出了DUI平台,我们在DUI平台基础上针对之前的经验做了一套新的更安全的,因为安全这个点是前装的主机厂最在乎的一个方向,我们把它叫做天琴助手,天琴的安全凸显在哪几个方面?

回到刚刚讲过的当前的车载场景下的内容需求,以前整个行业都在犯一个错,我们把所有的内容给分割来看了,导航是导航,在线的电台是另外一回事,票务、股票甚至于像天气它属于内容,我们会单点去优化。在这个里面其实他们有一个共同点,如果把它看成一个整体,它其实是不分领域的。你不用把天气单独划为一个功能,把票务单独划为一个功能,他们很多功能如果你要考虑安全,是可以汇总的,所以天琴很大的一个优势在于针对驾驶场景贴合交互需求,我们不再提内容了,我们提的是交互需求,去做更安全的保障。

举几个点去讲为什么能够贴合安全?首先我们会把导航场景下所面临的有可能发生安全隐患的问题进行解决。比如在导航的时候,我们在之前的系统里面会有很多种交互方式,不走高速,3D模式,业绩模式,白天模式,在导航的时候我们会接到来电去打断屏幕,接到微信屏幕会中断,而所有的这些屏幕打断的次数会影响车主在导航过程的驾驶安全,所以我们会把车载导航包括像电话和其他的社交内容结合起来去做一些产品的优化,比如可以快速的定义基于行为习惯的导航交互。我们引入了第三方电话拦截技术,对一些骚扰电话进行提前的预警、判断和拦截,我们还支持基于导航地图周边的其他的信息推荐。在之前我们可能会说我饿了想吃饭,现在我们会支持我想找一个人均200左右的快餐店,其实是为了保障更快、更方便的交互,而不是传统的我给你个说明书,你对照看我们有什么功能。

另外我们会有一个更高频次的个性化助手,我们在天气里面已经率先把声纹技术进行了运用,我们不仅能识别性别,还能识别主人的身份。在这个前提下我们能去做更多的收藏内容推荐,去做更多的账户登录,还包括后端基于声纹的唤醒。右边的例子,是一个男性车主在唤醒助手,这时候会提示小哥哥,在性别的前提下,我给男性车主推荐的歌曲一定是比较偏摇滚的、偏男性化的,反之如果是女性则其反。之前我们会基于天气、音乐去做很多的深入优化,那么在这版的天气里面我们能够支持目的地未来24小时的天气预报,这个里面其实是把类似于像票务、天气、途经地点、导航目的地做了一个更多元化的结合。

另外从技术上,我们会针对在车载场景下的语音技术去做单点优化,保障三个快,快识别、快理解和快反馈。在开车的情况下,如果车主的手离开方向盘大概一到两秒之间就有可能会有安全隐患,所以在整个的交互里面如何减少交互频次,提高反馈速度是非常重要的,我们也对在不同场景里面包括开窗,高速山路里面的交互做了非常多的实测。

另外就是技能了,我们把所有的语音技术跟后头的内容做了匹配。这里面讲一个技能,我们会觉得类似于客服、天气、车况等一些不应该在背后的功能是分割开的。所以我们现在是直接在天气里面内置一个智能客服助手,基于思必驰的知识图谱和对话引擎,直接把它内置在整个服务后端,而客服助手背后的Bot是可以因厂商而定义的,支持用户去自定义。今年我们有可能会推出人机耦合的混合智能客服,保障更好的交互和服务,把传统和现在AI进行结合,我们的产品现在应该在规划里面,可能到下半年会有进一步的消息。

另外最开始提到的声纹问题,包括控制车窗的问题,有一个主机厂说希望控制驾驶、控制风速、空调等等。其实在过去两三年里面我们更多的是在车载场景下提供纯软方案,就是单麦或最多双麦的方案。现在我们在基于天琴助手,能够提供更多音区的方案,比如双麦的、四麦的,有什么用?第一,基于麦克风阵列所在的位置能够去做更好的识别,能够去做更好的降噪,能够去做更好的声纹,更好地去识别谁是主驾,谁是副驾,你要开窗你控制的是主驾的窗还是副驾的窗。但是这个功能具体要拿语音是不是去做开窗的控制,我们觉得还有待商榷,毕竟前提是为了安全,我们只是说从技术的方向去考虑如何更好的保障整个的安全。但是如何去做产品的安全判断,还是要由客户来决定。

另外还有一个点是车萝卜,车萝卜是一家做HUD的厂商,但同时它也是我们的子公司。所以我们基于天琴助手,跟车萝卜的HUD模块做了结合,在传统的针对前装车场,在传统的HUD模块里面只能做到投射到前方2.5米,而现在车萝卜针对前装汽车主机厂优化HUD的模块能够投放到前方7.5到40米的距离,而且传统的HUD最多会告诉你车速、转速还有导航的箭头,但现在车萝卜新的模块里面还能够同时提供车道偏离预警、前车碰撞预警、行人检测等一些前车碰撞预警功能。

现在我们天琴虽然正式发布不久,但其实在2018年的时候我们就有了很多的合作客户,包括像小鹏汽车,还有上汽的一些产品,我们会针对主机厂包括互联网汽车企业,还包括后装的产品方提供不同版本的天琴助手系统。我们希望从技术方面尽可能保障更好的、更人性化的交互体验,和更安全的驾驶交互方式。谢谢大家。

敬请关注盖世汽车“2019全球第二届自动驾驶论坛”直播专题

PC:http://auto.gasgoo.com/NewsTopic/173.html

移动:https://m.gasgoo.com/news/Topic/173

提示:本文为现场速记,未经专家审核,请勿转载!

*版权声明:本文为业内专家原创文章,作者本人对文章观点及内容合规性负责。如有疑义或转载需求,请联系作者。

本文地址:https://auto.gasgoo.com/News/2019/02/21050320320I70089409C303.shtml

 
0

好文章,需要你的鼓励