• 采购项目
  • 配套企业库
  • 销量查询
  • 盖世汽车社区
  • 盖世大学堂
  • 盖亚系统
  • 盖世汽车APP
  • 2024第七届智能驾驶与人机共驾论坛
  • 2024第六届智能驾驶地图与定位大会
  • 2024中国汽车低碳与可持续发展论坛
  • 2024智能座舱车载声学大会
  • 舱驾、行泊一体及BEV视觉感知培训
  • 2024第二届吉利汽车技术论坛暨前瞻技术展
当前位置:首页 > 智能网联 > 正文

搭载AI技术 车载智能语音不止听懂指令还会“读心”

盖世汽车 熊薇 2017-03-28 17:16:40

随着汽车自动化程度越来越高,大量的新功能和新技术被集成到人机界面,加大了汽车系统的复杂性,同时也增加了驾驶员操控汽车的难度。当驾驶员忙于应对各种汽车电子产品时,他们更容易从驾驶中分心,甚至引发交通事故。因此,找到一种方法让驾驶员或车上其他乘客与新技术、新功能简单、快速、有效地开展交流,于当下的车企和零部件供应商尤为重要,事实上他们也正在进行相关的尝试,并且成效显著。

就目前汽车上搭载的人机交互技术而言,手势控制、生物识别、语音控制几种相对较成熟,已有实车应用。其中手势控制,宝马7系是一个典型代表,它可以识别6种预设手势操作,实现音量、导航、通话和空调等的设置;生物识别技术则在今年的CES上大放光彩,大陆、FCA集团均有相关技术展示;语音控制以Nuance走在行业前列,技术较为成熟。

近日,盖世汽车受邀在“2017年Nuance中国汽车论坛”上采访Nuance车载业务部高级副总裁兼总经理Arnd Weil、大中华区总裁及集团副总裁蒯文瑞、研究部副总裁吴建雄三位高层代表,在现场了解到Nuance凭借其在人工智能、自然语言理解以及人机互动界面方面的技术创新,目前已成功实现人与汽车技术之间简便、自然的交流。

搭载AI技术 车载智能语音不止听懂指令还会“读心”

Nuance公司有一个专门针对汽车领域的互联汽车平台——Dragon Drive(声龙驾驶),Dragon Drive可以提供认知推理功能,让汽车制造商将智能虚拟个人助手深入集成到人机界面中,凭借来自汽车和驾驶员的语境化和情境化数据,聆听、理解、推理驾乘人员的需求并做出反应,包括主动推荐导航路线、兴趣点、音乐等。

为了让在场媒体感受更直观,采访期间Nuance用搭载了该公司语音技术的新款宝马汽车和荣威RX5进行了语音控制实车演示。据了解,现场演示的新款宝马汽车运用了Nuance的混合式本地加云端的语音识别、自然语言理解、语音打断以及语音合成解决方案等,可直接在主菜单中语音访问导航、音乐、信息听写、天气等功能、应用和服务。

搭载AI技术 车载智能语音不止听懂指令还会“读心”

而荣威RX5则集成了Nuance Dragon Drive本地嵌入及云端混合式语音识别和基于深度神经网络的自然语言理解技术,同时还采用了语音信号增强及语音合成技术,使用户只需简单说出“你好,斑马”便可以用语音激活系统,进行拨打电话、搜索流媒体或本地音乐、查询天气信息、搜索兴趣点等操作,从而减少驾驶员因手动操控主菜单受到的干扰,提升驾驶安全。

Nuance高层表示,目前每年约有4000万辆新车搭载了Nuance的语音技术,占全球年新车产量的一半。 随着越来越多的功能和技术被集成到人机界面,系统越来越复杂,Nuance将以实现人和科技之间的交互更自然、更简便为使命,通过语音技术、自然语言理解技术、人工智能技术等,帮助车企实现复杂功能的同时,减轻用户的操作难度,使用户与汽车系统、科技之间的交互变得更顺畅。下面为本次采访实录:

搭载AI技术 车载智能语音不止听懂指令还会“读心”


Nuance是2014年开始跟华为进行合作的吗?那么跟中国本土其它企业,比如跟汽车企业的合作是什么时候开始的?除了荣威,还有什么其它项目?

如果计入文本输入方面的合作,我们跟华为合作时间已经快8年了,并不是2014年才开始的,只不过涉及语音的相关合作是2014年才开始的。第二个问题,我们跟中国本土企业的合作很早就开始了,这四年针对中国市场已部署了专门的研发团队,如提供混合的方案——本地+云端,因为中国的网络没有那么发达,不是每一个地区都有4G,也有的地区根本没有信号,加上中国的流量数据费用比国外贵,在这种情况下,混合方案对国内的消费者很有必要。最后一个问题,我们几乎跟全球领先的汽车公司都有合作,包括宝马、上汽、吉利、奔驰等,合计约有14,000,000 多万辆行驶在道路上的汽车使用了Nuance 语音技术。

在2016和2017宝马汽车上,Nuance用到了一个多乘客的交互解决方案,让驾驶员和前排乘客能够宝马互联车载信息娱乐系统进行交互,这一方案仅限于驾驶员和前排乘客吗?

从技术上来说,多乘客的交互解决方案主要是用于实现不同的人在不同的位置上说话,系统能够识别谁在说话,从而把其它人的麦克风给关掉。因此,从该解决方案本身来讲,并不限于前排还是后排人员,而是取决于车商要放几个麦克风,要开发什么样的应用。

搭载AI技术 车载智能语音不止听懂指令还会“读心”


Nuance的语音识别技术更偏重数据的积累还是新算法的开发?它们的贡献率各自大概是多少?

由于每个阶段贡献的程度、来源都可能会不一样,所以我很难直接回答到底是数据贡献大还是算法贡献大。我只能说,数据是一个持续的过程,而算法有时候会有一个好的算法,能够提高很多,但有的时候修正的相对比较少,因为如果系统性能的起点比较低,算法提高了,可能会感觉系统算法很好,但如果系统本身性能很好,后面算法的改进程度就会相对小一点。所以对我们来讲,只能说数据和算法同样重要。

Nuance满足了车与车内人、车外人、停车场等之间的交流沟通,这么大的信息量,是不是需要一套机制来保证信息不被泄露?

信息的泄露其实有两个层面的问题,一个是车内系统的问题,还有一个是数据保护的问题,其中在第二方面——数据的保护和数据的使用权限上,Nuance跟其它公司相比,无论经验方面还是内部的过程方面,都会领先很多。我们有一套非常完整的数据保护、数据使用权限系统,该系统已经被用在银行系统上面,美国的医院也有用到。

我们知道AI有自主学习的能力,那么通过AI Nuance的语音技术是不是能够学习中国所有地区的方言,并对方言形成理解和认知?

方言从某种意义上来讲是一种新的语言,因此可能会比较难一点,更何况中国的方言还有一个很大的问题——没有书写语,所以学习起来困难更大,但并不是说完全不可能,其实我们现在已经有计划了。

目前Nuance有B2C的业务吗?或者说未来在全自动驾驶时代,当车载语音技术成为汽车的一种标配的时候,会考虑B2C的模式吗?

Nuance没有考虑B2C的商业模式。Nuance作为一个快速成长的公司,在过去20年里并购了近90家公司,这90家公司里可能有几个是B2C模式的,如Nuance 的Dragon NaturallySpeaking 盒装语音识别软件,就是直接对应消费者的B2C模式。但是Nuance公司的策略是B2B,我们主要是提供技术解决方案,帮助电信、金融、汽车等行业各种各样的企业更好地进入这个时代,而不是去建立一个B2C的产品,目前我们也没有计划去改变公司的策略。

刚刚介绍说在整个市场上Nuance所占的份额很大,已经具有领先的优势,并且后面要继续保持这种优势,那么Nuance以后要保持这种优势的信心来自于哪里?

信心来自于创新,具体来说有四个方面:第一,在核心技术上面我们有足够的投资。以中国为例,之前我们在中国的研发中心只有北京和上海,今年我们在成都也开设了新的研发中心,从年初到现在已经有60个工程师,到2018年之前争取有200个工程师在成都,使成都成为集团重要的据点。第二,我们有自己专注的领域,而不是所有的东西都做,甚至有些东西我们可以跟竞争对手合作。第三,我们提供端到端的解决方案,而且很专注于给我们的客户提供服务。第四,全球的人才跟中国市场的人才形成一个团队,大家一起做研发。

*版权声明:本文为盖世汽车原创文章,如欲转载请遵守 转载说明 相关规定。违反转载说明者,盖世汽车将依法追究其法律责任!

本文地址:https://auto.gasgoo.com/News/2017/03/28051640164070009793C601.shtml

文章标签: 新车新技术
 
0

好文章,需要你的鼓励