当前,智能驾驶技术正经历从“规则驱动”到“数据驱动”、再到“知识驱动”的范式跃迁。如何让AI不仅“看见”世界,更能“理解”和“思考”物理世界,成为行业竞逐的下一制高点。
2026年6月17日,在2026第九届智能驾驶与出海大会上,长城汽车智能驾驶产品资深专家陈龙,分享了长城汽车在VLA(Vision Language Action)大模型量产应用上的最新探索与实践。
陈龙指出,下一代智能驾驶的核心在于让算法自带知识,长城汽车已将VLA架构与云端世界模型协同落地,使汽车具备“听得懂、看得见、会思考、可信任”的类人能力,推动用户体验从“能用”“敢用”向“好用”“爱用”全面跃升。
陈龙 | 长城汽车智能驾驶产品资深专家
以下为演讲内容整理:
智能驾驶算法演进的三个时代:从“规则”到“知识”的范式转型
回顾过去五六年的发展历程,智能驾驶算法经历了清晰的三代跃迁。最早是模块化智驾时代,所有传感器信息被拆分,分别进行感知、融合、决策和执行,这一阶段主要由工程师针对每一个具体场景编写代码,通过规则驱动实现驾驶行为。这种方式的局限性在于,场景一旦没有被代码覆盖,系统就无法处理,因此早期的智驾系统在很多地方无法激活,可用场景非常有限。对于企业而言,这是一条不可持续的道路——现实世界中的规则几乎无法被穷举,代码永远写不完。
到了2023年左右,以特斯拉FSD为代表,端到端大模型开始被引入智驾系统,行业进入数据驱动时代。这一阶段的核心转变在于,系统不再依赖人工编写规则,而是通过海量驾驶数据训练模型,让算法自主学习如何驾驶。然而,数据驱动同样面临瓶颈:如果某个场景从未出现在训练数据中,系统仍然无法有效应对。例如,在高速公路上遇到施工区域,如果数据库中没有类似场景,车辆可能选择刹车甚至直接撞上去。这就是所谓的“长尾问题”——虽然大部分场景已经能够覆盖,但特殊工况下系统仍可能“宕机”。
正是基于对上述瓶颈的深刻认知,长城汽车认为,下一代智能驾驶必须走向知识驱动。知识驱动的本质是让算法体系本身具备知识,而不是仅仅依赖外部输入的数据。VLA大模型的出现,正好提供了实现这一目标的技术路径——它将人类语言中的世界知识融入智驾系统,同时通过语言理解来增强对物理世界的感知和推理能力。
VLA+世界模型:车端云端协同的技术架构
图源:演讲嘉宾素材
基于上述思考,长城汽车推出了全新的VLA技术体系,采用车端VLA大模型与云端世界模型协同的架构方案。在车端,系统通过多传感器进行空间编码,将摄像头、激光雷达等传感器的输入转化为对三维物理空间的感知表征。与此同时,文本编码模块将导航指令、互联网知识等语言信息融入大模型,形成融合语言理解与空间感知的统一知识体系。
这一架构的输出分为两个并行部分:首先是轨迹输出,即VLA模型直接生成车辆的控制指令,实现对车辆的操控;其次是思维链推导,系统将当前场景的理解、决策依据等信息通过文本解码,在屏幕上呈现给用户,增强人机交互的透明度和信任感。在最终的控制输出端,系统后端还设有一个策略层,基于安全、效率、舒适等多个维度对模型输出进行综合评估和约束,确保车辆行为既符合驾驶意图,又满足工程可靠性要求。
技术赋能:听得懂、看得见、会思考、可信任的产品体验
在用户体验层面,长城汽车将VLA技术能力转化为四个核心产品价值主张。第一是“听得懂”。智能汽车被认为是具身智能的第一站,而人与汽车最自然的交互媒介就是语言。长城汽车从用户日常驾驶中的高频场景出发,让VLA模型学习并理解“前方左转”“开快一点”“开慢一点”等自然语言指令,使汽车真正能够听懂驾驶员的意图。
第二是“看得见”。VLA模型不仅要理解摄像头拍摄的图像,还要理解激光雷达等传感器采集的三维空间信息,能够准确识别当前场景中的物体、道路边界、障碍物等要素,判断应该规避什么、应该沿着哪条路径行驶。这是实现安全驾驶的基础感知能力。
第三是“会思考”。这是VLA相较于前两代算法最核心的跃升。长城汽车的VLA方案能够让汽车具备类人的推理和决策能力——看到泥泞路面会主动放慢速度,知道这里不能开快;遇到狭窄小路也会调整车速,判断谨慎通过。这种“思考”能力的来源,是让模型学习大量人类驾驶员在不同场景下的决策逻辑和应对策略,而非简单的场景记忆。
第四是“可信任”。当车辆听得懂、看得见、会思考之后,最终要赢得驾驶员的信任。这种信任一方面来自系统性能的持续提升——越来越多的复杂场景被有效应对;另一方面来自交互透明度的增强——长城汽车在车内显示屏上实现了思维链的可视化呈现,通过图像标注和文字提示,告诉用户当前场景中哪些因素在影响驾驶决策、系统为什么选择减速或加速,让用户能够理解车辆的“想法”,从而建立深层次的安心感。
行业愿景:技术赋能体验,让每一代产品实现体验跃升
长城汽车始终认为,技术的价值最终要体现在用户体验的改善上。在规则驱动时代,用户对智驾的感知是“能用”——高频场景被逐一覆盖,但体验并不连续。在数据驱动时代,凭借数百万辆量产车的数据回收和模型训练,用户开始“敢用”系统,但面对未见过的场景仍会心存疑虑。而在知识驱动时代,借助VLA大模型和世界模型的知识注入,系统的泛化能力和场景适应能力大幅提升,用户的体验目标将跃升为“好用”和“想用”——不仅能力更强,而且行为更接近人类驾驶员的判断,交互过程更自然、更可预期。
长城汽车在智能驾驶领域已深耕十余年,拥有深厚的技术积累和庞大的量产数据资源。面向未来,长城汽车将继续沿着VLA技术路线坚定推进,持续探索语言知识、空间智能与世界模型的深度融合,让智能驾驶真正成为用户出行中值得信赖的伙伴。
关于长城汽车
长城汽车是全球知名的SUV和皮卡制造企业,已于2003年、2011年分别在香港和内地上市。长城汽车旗下拥有哈弗、魏牌、欧拉、坦克及长城皮卡等品牌,产品涵盖SUV、轿车、皮卡及新能源汽车等多个品类,产销网络覆盖全球多个国家和地区。在智能驾驶领域,长城汽车坚持全栈自研与开放合作并举,持续推动AI技术在量产车型中的创新应用,致力于为全球用户提供更安全、更智能的出行解决方案。
(以上内容来自长城汽车智能驾驶产品资深专家陈龙先生于2026年06月17日第九届智能驾驶与出海大会发表的题为《AI 应用上车加速度:长城汽车VLA实践与探索》的演讲。文中提到的“智能驾驶”技术为辅助驾驶系统,不能完全替代驾驶员。驾驶员在任何时候均需保持对车辆的监控,并做好随时接管车辆的准备,请严格遵守交通法规。)
本文地址:https://auto.gasgoo.com/news/202606/23I70462897C106.shtml
 
联系邮箱:info@gasgoo.com
求职应聘:021-39197800-8035
简历投递:zhaopin@gasgoo.com
客服微信:gasgoo12 (豆豆)
新闻热线:021-39586122
商务合作:021-39586681
市场合作:021-39197800-8032
研究院项目咨询:021-39197921
