当前位置：首页 > 活动 > 正文

微课堂：智能语音在汽车上的应用&发展趋势（实录）

盖世汽车网阮建&梁薇 2015-05-25 10:59:03

5月21日晚8点30分，“盖世微课堂——智能语音产品在汽车上的应用与发展趋势”正式开讲！盖世汽车特邀车音网两位联席CEO苏雨农及王力劭博士开堂授课并解答微友疑问，同时，来自科大讯飞等相关行业的共322位人士在群内展开热烈讨论。以下是课堂焦点内容速记汇总，与业内共飨！

本次课程主要围绕两点：第一点，智能语音产品在汽车上的应用状况如何，未来的研发重点是什么？第二点，国内智能语音产品，目前面临着哪些缺陷或困难，是否已有解决的方向？

一、智能语音产品在汽车上的应用状况如何，未来的研发重点是什么？

针对智能语音产品在汽车上的应用状况，目前主要可以分为以下两个观点，第一应用的很好，第二应用的不好。

目前国外的汽车已经开始配备了嵌入式的语音技术，比如语音打电话以及语音指令，而国内的车企也开始尝试运用语音交互和语音平台，从这方面来说，智能语音产品和汽车的结合很好。

但是谈及应用，必然要和人打交道，会涉及到用户体验，从人性化的角度来看，这方面还需改善。

◆针对应用现状，未来的研发重点是什么？

▲1. 技术化

1）语音并不是简单的把一个识别的引擎和一个硬件车机绑在一起，就能够让用户体验很好。如果麦克风不好，那么语音识别本身引擎再好也发挥不了作用。因此在硬件方面，包括麦克风阵列以及整个车机设计将是未来语音识别重点发展的方向。

2）“容错”，即对口音的容忍性，具体分为对声音的容错与对信息的容错。现实生活中，对于突如其来的噪音以及无意识的口误，语音技术能否结合搜索技术并做到容错至关重要。此外，语音技术还要能够听懂各地方言或各种表达方式。对于用户而言，往往会追求多样性，包括使用过程中发生偶然状况几率的多样性以及基于场景的多样性等，针对上述多样性，容错技术也显得尤为重要。

3）语音技术完成识别之后，还需要进行自然语言处理（NLP）和搜索，通过对自然语言的处理和理解，加上搜索技术和正确的返回信息，形成一个巨大的数据库或知识库，这种数据库或知识库可以针对语音识别的结果提供反馈信息。在用户看来，既然说的话被识别，其返回来的结果就应该正确，而不会去纠结识别出错抑或搜索出错，因此自然语言处理和搜索这两项技术的成熟度，也直接影响了语音识别技术的反馈结果。

4）从设计体验角度来看，目前对于技术出身的设计者往往是从自身设计角度出发，只关心语音能做什么，从而导致语音设计存在一定的问题，而我们应该更多地以用户的应用场景以及应用需求为出发点，去开发及设计语音产品。

▲2. 人性化

1）用户对于产品的交互界面和体验感受，关于用户如何看待语音产品，需要我们精准聚焦需求。例如面对一款语音产品，当它问你需要什么服务，可能你想不起来，或者不清楚该如何表达观点，精准聚焦需求显然很有必要。

2）用户真正关心的是并不是技术本身有多么高级，更多的是关心该技术能否按照要求去完成任务，所以，对于这种用户需求，达成率远比识别率更重要。

3）去语音化。语音技术出身的科学家及车载产品经理，可能会陷入技术化的思维，而去语音化就是在产品设计时考虑用户因素，真正去面对客户的对语音的使用需求场景。

二、国内智能语音产品，目前面临着哪些缺陷或困难，是否已有解决的方向？

●困境1：语音技术的应用地位

1999年，车音网团队开始研究一种称为“非特定人”的语音识别技术，在研究过程中，该公司试图建立一个对答如流的小机器人，如今很多有实力的公司已经实现了该技术。

随着人们需求和认知得到提升，很多人认为语音很炫，代表了未来的智能化方向，导致厂商一拥而上，纷纷进入该领域。

抛开语音的识别率以及语音识别之后搜索结果的准确性等技术问题，目前语音的应用能力以及应用场景如何？

语音助手。语音助手回答的问题或许具有可用性，但其回答方式却往往缺乏趣味性，也不能超出用户的理解和思维，而这也是语音产品带给人的期望和实际上呈现出来的性态之间的差距。

解决问题的方向：指令型、搜索型、陪聊型

●困境2：语音技术过程化中的去技术化

现实生活中，语音技术的应用会面对类似感性思维和理性思维的困扰，因此在设计产品时，设计者抱着“我有什么然后做什么”的态度还是根据用户看法和需求来做产品，这两种方法都将决定未来语音技术的趋势。

●困境3：盈利模式问题

纵观整个行业，目前无疑分为传统盈利模式以及互联网媒体盈利模式，两种模式的根源主要是围绕从技术出发还是从盈利角度或未来价值实现角度出发点，具体的模式主要分为以下几种：

1）产品售卖

2）服务租赁

3）影响力寻租

4）“东边不亮西边亮”，即语音技术在其它领域获得更高的收益值

在语音识别的应用中，如果不能将其影响力传递给使用者，那么语音技术和语音平台如何去谋求长远的利益转化，值得我们思考。

解决方法分为两种：

1）将语音作为一种手段，重点垂直扎根于行业中。

2）从语音技术本身去谋求赢利，将免费开放平台转化成最终利益。

三、问答环节：

1、如何看待基于云系统的语音识别和基于车内置系统语音识别的发展趋势？

王总更加看好云系统。随着带宽能力提升，资费降低，云系统依托大服务器群、大模型、大并发，所以识别能力和语义分析能力更好。而且云系统可以在更多场合使用，而嵌入式芯片因为设备局限性，提升能力有限。

2、口音和方言是语音识别的一大障碍，这一问题有没有什么较好的解决方案？

王总表示，关于口音问题，如果有足够的语料（包括车载其它环境下的各种语料）采集，那么口音问题并不会造成太多障碍，关键在于语料采集量是否足够多。

苏总认为，经过训练后，语音识别也可以支持天津话、山东话等方言，但很多地方即使隔着一座山也会存在口音差异，对于这种情况，语音技术并不是不能识别，而是没有必要识别。

3、除了目前的和娱乐、导航相结合，未来是否有何别的车内模块相结合的应用点，比如最近很火的主动安防系统之类的？有哪些能让用户产生粘性的应用点？

就目前而言，语音作为一项辅助技术，主要是为了帮助用户在复杂环境下完成搜索，而不是简单的选择功能。由于车场以及用户对于其他功能的需求并不是特别高，因此现在尚未考虑其它应用点。

4、那么大的数据库都需要保存在云端吗？

语音特征数据库及知识库，多数都保存在云端，不过，行车手册和保险等一般存在本地比较妥当。

5、语音交付中，语音识别如何做到更精准，车机在语音识别上要做哪些特定设计才能有助于识别？

通过麦克风、降噪。后台引擎垂直度以及训练过程于车载环境的结合度

6、商用车的语音发展前景如何？

如果不针对车载场景进行对标设计，可以直接用引擎，这是当今科学极限的问题。

7、请问对于云端引擎和本地引擎相结合的混合模式，如何在响应速度和准确率之间达到平衡？

云端和本地混用，本地相对简单，但实用的场景产品如打电话，做起来更好，其它的主要还是依赖云端。因此，语音一定要用在合适的场景下，

在没有脑电波的条件下，语音是较好的解决方案。

苏总：人和车的交互，从机械到触屏再到语音，机械的解除更踏实，更显示质感。

8.语音升窗应用如何？

远不及一键升窗来得方便

9.单纯的考虑实现智能语音只会增加研究的压力和困难，很多功能用语音不见得比遥控更方便。

苏总：语音只是便捷的工具，不是万能的，在这个阶段，我们希望语音实现的功能更聚焦，更安全，更能保证服务的达成。

王总：语音一定要在合适场景下使用，交互要人性化，当识别达不到要求时，云端会自动帮助用户开启人工搜索，而此时，用户其实并不会太在意。总之，善用语音，慎用语音，垂直聚焦，体验为上。

10.语音识别如何做到更精准？

我们使用的任何语音识别的模型都存在一定的局限性，而且语音技术本身是一项概率技术，因此即使该技术能够做到精准，但是外部的不可抗因素也可能会导致语音识别失效。

（文章来源：盖世汽车网）

本文地址：https://auto.gasgoo.com/News/2015/05/22052317231760336308203.shtml

好文章，需要你的鼓励

增程，跳出了技术“鄙视”？

24小时热文

作为采购商，我可以：

作为供应商，我可以：

微课堂：智能语音在汽车上的应用&发展趋势（实录）

联系我们

合作电话

站内导航

关于盖世