2025年12月17日,在第七届AI智能座舱与显示技术大会上,理想汽车高级总监李娟深入阐述了智能空间的发展理念,其核心在于通过空间交互与智能交互两大主线提升用户体验。空间交互方面,理想汽车提出了“三维五屏空间交互”概念,通过多模态交互体系,实现从二维到三维的升级,并引入分区空间交互,满足不同区域乘员的独立需求。同时,车内座椅的灵活布局为空间交互提供了更多可能性,支持更丰富的场景体验。
智能交互领域,理想汽车自主研发大模型,并将其应用于车辆中,通过任务型服务体系降低用户认知负荷,实现一句话完成所有相关任务。同时,理想汽车打通了诸多生活场景服务,如快速取餐等,并推出调音大师、任务大师等功能,满足用户个性化需求,推动“用户定义汽车”的新阶段。李娟表示,未来理想汽车将继续探索自然交互与意图交互,提升用户体验。
李娟|理想汽车高级总监
以下为演讲内容整理:
智能空间
智能空间的核心在于通过特定空间内的服务实现用户体验。为有效支撑这一服务,我们将其规划为两条主线,这两条主线是一个有机联系的整体。第一条主线是空间交互,旨在构建一个灵活有趣的空间,并提供极致的空间体验。第二条主线是智能交互,目标是为用户提供一个能够持续成长的智能助手,并最终成为其有机的硅基伙伴。
空间交互
在智能座舱中,我们始终聚焦于服务车内人员,因此人机交互至关重要。相比之下,车辆的其他部分,如智能辅助驾驶与整车电子化,主要服务于车辆本身,旨在提升驾乘舒适性与自动化水平,从而为用户节约精力。两者服务的对象不同。
从交互维度来看,车内空间在交互对象和交互模态上与常见设备存在显著区别。以手机或电脑为例,它们本质上是二维平面设备,服务对象单一,通常仅针对用户个人,因此交互模态也相对简单。例如,PC主要依靠键鼠操作,手机则以触控为主。而车内环境则完全不同。首先,车辆不论用于商务或家庭,其设计需要服务于包括驾驶员在内的所有乘员。其次,车辆本身是一个完整的立体空间,交互行为需在三维空间内进行。此外,我们致力于打造多模态交互体系,不仅限于触控,更融合视觉、语音等多种模态,共同构成完整的空间交互体验。
空间交互层面,我们提出了“三维五屏空间交互”概念,将人机交互划分为感知、理解与表达三个环节。在车内环境中,感知层面的听觉与视觉,以及表达环节,均实现了从二维到三维的升级,从而构建出真正的空间交互能力。
然而,随着技术发展,我们发现单一的统一空间交互模式已无法充分满足用户需求。例如,在家庭用车场景中,当后排儿童观看电影时,前排驾驶员往往无法同时收听音乐或享受音频服务。
为解决这一问题,我们提出了分区空间交互的概念。通过将车内空间划分为前后等不同区域,实现后排乘客观看影音内容的同时,前排驾驶员仍可独立享受音乐或其他音频服务,从而提升长途出行等场景下的体验,缓解行程中的枯燥感。
为实现分区交互,我们在技术架构上进行了重构。感知层面需具备分区感知能力,中央处理系统需实现分区理解,最终驱动听觉与视觉表达系统进行分区呈现。因此,从感知、理解到表达的完整链条均需实现分区处理,这也使分区交互成为智能座舱发展的重要趋势。
此外,空间交互的灵活性核心在于车内座椅的布局与可调性。座椅的可移动与变换能力是拓展空间使用场景、丰富交互多样性的关键基础。正是基于这一能力,智能空间得以支持更丰富的场景,并为多元化的空间交互创造了可能。
许多人提及车辆时,往往忽略了一个方面,即我们可以在车内拥有一个宽敞的大客厅或大卧室,从而提供多样化的体验。这些丰富的体验,涉及两个维度,一是“有”,即是否具备相关功能或空间;二是“好”,即这些功能或空间的体验是否足够优质。
以客厅为例,它绝不能显得狭窄局促,而必须让人感到舒适。为了实现真正的大客厅体验,我们需要配备相应的设施和配件。比如,当我们在客厅里一起玩耍或品茶时,就需要有合适的桌板等配件来支持这些活动。再比如家庭影院系统,它要求我们对光环境进行精准控制,提供全景声的沉浸式体验,以及设计大尺寸的屏幕,这些元素共同构成了一个有机的整体。只有这样,用户方能获得更贴近实际物理世界的家庭影院体验。因此,我们持续致力于通过空间打造、舒适性提升,以及各类环境因素的有机融合,来构建多样化的空间交互体验。
智能交互
在探讨智能交互时,我们首先关注的是其能否为用户提供更多有意义的功能,助力用户完成更多有趣的事情。理想同学在2024年累计唤醒次数达到了13.8亿次。而在五一期间,单日唤醒次数更是高达1200万次。取得如此出色的数据表现,主要在于理想同学足够智能,能够切实帮助用户处理事务,进而提升了用户对它的信任感。
在打造理想同学的过程中,我们始终坚持自主研发大模型,自2023年起,便着手构建并率先将自研的GPT大模型应用于车辆中。随后,我们逐步进行迭代升级,前期先开发了一些智能体,后续逐步具备了长思考和短思考的能力。到了2025年,我们开始运用agent的整体服务与生态,通过CUA能力和A2A能力,构建起连接数字世界与物理世界的服务。同时,我们还拓展了智能体的生态,从而赢得了众多用户的欢迎。
智能交互应用场景上。首先,我们会利用AI大模型的能力,设法降低用户的认知负荷。我们致力于将功能型服务升级为任务型服务。功能型服务中,用户通常通过发出具体指令来操作,例如“开启导航”“开启空调”“打开座椅加热”“打开车门”等,这些均属于单一功能。用户需自行拆解这些功能,并调度AI来完成相应服务。然而,用户实际上更期望能够仅通过一句话,甚至无需言语,即可让系统自动完成所有相关任务。为此,我们构建了一整套任务型服务体系。用户只需提出一句话需求,后续所有任务功能的拆解以及连续、连贯的任务执行,均由AI负责完成。
我们将整个服务升级为任务型模式。这种模式不仅体现在交停车费这一场景中——交停车费本身能够显著降低用户的认知负荷,让支付过程更加优雅;同时,它也是实现智能辅助驾驶后必备的一项能力。
此外,我们还打通了诸多生活场景的服务。例如,我们与肯德基合作,实现了快速取餐服务。用户只需一句话,系统便可自动为其点选喜爱的套餐,并指定取餐地点。除此之外,点咖啡、点外卖等各类生活服务能力也已上线,并通过OTA推送给了用户。
智能交互还带来了另一项变革。我们过去一直强调“软件定义汽车”,而未来则应迈向“用户定义汽车”。软件定义汽车的能力指的是将整个移动互联网的生态迁移至车内,涵盖出行服务、音频、视频、游戏以及生活类应用等,旨在让用户在车内能够完成更多与生活相关的场景化服务。这是过去5到10年间,行业持续努力的方向。
然而,仅依靠软件定义汽车仍显不足。以理想汽车为例,目前我们已拥有160万用户,每位用户都有其个性化的需求,对软件功能和场景的定义也各不相同。如何满足如此庞大且多样化的用户需求,成为我们面临的重要课题。
为此,我们推出了大师系列。首个推出的功能是调音大师。之所以推出调音大师,是因为声音是一个极具主观性的元素,每个人对声音的喜好和偏好都不尽相同。有些用户偏好古典音乐,有些则钟情于流行音乐,对于不同类型的音乐,所需的调音风格自然也不尽相同。官方或许只能提供一套我们认为最优的声音配置,但用户需求千差万别,对声音的要求也各不相同。为此,我们推出了调音大师功能。
在调音大师的底层,我们开放了196个参数供用户调整,专业用户可针对这196个参数进行精细调校。对于非专业用户也无需担心,我们提供了不同类型乐器的预设音效进行播放,用户只需聆听并选择自己喜欢的乐器声音呈现方式,即可以一种简单直接的方式,定制出自己钟爱的音效,实现千人千面的听音体验。
针对任务大师功能,我们也做了诸多创新。由于用户需求和场景各异,通过任务大师,用户可以告知理想同学需要播放什么音乐或视频。通过这些功能,用户能够营造出各种充满仪式感的场景,同时也可设置安全提醒,甚至自主创作娱乐与交互内容。这些功能均由用户根据自身需求自行构建。此外,用户对桌面的诉求也各不相同。例如,有的用户当前正在学习英语,希望桌面上能常驻每日五个英语单词或五句英语句子,以便每日背诵;而有的用户则偏好球类资讯,希望桌面上能展示当前最热门、最火热的球类信息。
针对每个人对桌面的需求各异,用户只需一句话,即可生成符合自己喜好的桌面。如此一来,每个人的桌面都将独一无二,且每日可随心更换。如果今天不喜欢当前桌面,明天便可换成其他样式,从而更贴合用户当前的心情与状态。
要实现千人千面的效果,其底层支撑无疑是AI大模型所赋予的各项能力。
第二个关键要点在于,我们需要将原子化的能力进行拆解。第三个要点则是,基于对用户需求的深刻理解,构建起完善的记忆系统。此外,硬件方面需具备强大算力,最终推动我们进入用户定义座舱的新阶段。
关于交互发展,我们认为可分为三个阶段。目前,我们已开始迈入自然交互阶段。自然交互意味着用户能够通过多模态方式,如语言进行交互。例如,我们此前推出的指代功能便深受用户喜爱。用户只需说:“理想同学,帮我打开这个”,系统便能理解用户所指的是天窗还是车窗,并直接完成操作。这种交互方式无需用户特意记忆诸如左前窗、左窗、右窗、前窗,以及一排还是二排等复杂信息,更符合人类的交互习惯。
最终,交互将迈向意图交互阶段。它类似于人与人之间的交互,首先需要对交互对象有深入了解,不仅要掌握其历史喜好,更要洞察其当前状态与即时偏好。其次,双方需建立起足够的信任关系。如果AI能够持续准确地为用户提供帮助,用户的信任便会逐步累积。随着信任程度的提升,AI代理能够为用户处理的事务也将日益增多。此外,这一过程还需融合情感计算与行为建模等相关能力。唯有如此,方能真正进入意图交互阶段。
当前,我们正从自然交互向意图交互方向进行探索,致力于让用户在智能空间或智能座舱中,获得愈发便捷、好用的体验,让智能系统愈发聪慧,更能高效地协助用户处理各类事务,同时涵盖极致的空间体验能力。
(以上内容来自理想汽车高级总监李娟于2025年12月17-18日在第七届AI智能座舱与显示技术大会发表的《智能交互与空间交互》主题演讲。)
本文地址:https://auto.gasgoo.com/news/202512/19I70439466C106.shtml
 
联系邮箱:info@gasgoo.com
求职应聘:021-39197800-8035
简历投递:zhaopin@gasgoo.com
客服微信:gasgoo12 (豆豆)
新闻热线:021-39586122
商务合作:021-39586681
市场合作:021-39197800-8032
研究院项目咨询:021-39197921
