当前位置：首页 > 活动 > 正文

长城汽车：AI 应用上车加速度——长城汽车VLA实践与探索

盖世直播许晴 2026-06-23 12:28:07 长城汽车智能驾驶

当前，智能驾驶技术正经历从“规则驱动”到“数据驱动”、再到“知识驱动”的范式跃迁。如何让AI不仅“看见”世界，更能“理解”和“思考”物理世界，成为行业竞逐的下一制高点。

2026年6月17日，在2026第九届智能驾驶与出海大会上，长城汽车智能驾驶产品资深专家陈龙，分享了长城汽车在VLA（Vision Language Action）大模型量产应用上的最新探索与实践。

陈龙指出，下一代智能驾驶的核心在于让算法自带知识，长城汽车已将VLA架构与云端世界模型协同落地，使汽车具备“听得懂、看得见、会思考、可信任”的类人能力，推动用户体验从“能用”“敢用”向“好用”“爱用”全面跃升。

陈龙 | 长城汽车智能驾驶产品资深专家

以下为演讲内容整理：

智能驾驶算法演进的三个时代：从“规则”到“知识”的范式转型

回顾过去五六年的发展历程，智能驾驶算法经历了清晰的三代跃迁。最早是模块化智驾时代，所有传感器信息被拆分，分别进行感知、融合、决策和执行，这一阶段主要由工程师针对每一个具体场景编写代码，通过规则驱动实现驾驶行为。这种方式的局限性在于，场景一旦没有被代码覆盖，系统就无法处理，因此早期的智驾系统在很多地方无法激活，可用场景非常有限。对于企业而言，这是一条不可持续的道路——现实世界中的规则几乎无法被穷举，代码永远写不完。

到了2023年左右，以特斯拉FSD为代表，端到端大模型开始被引入智驾系统，行业进入数据驱动时代。这一阶段的核心转变在于，系统不再依赖人工编写规则，而是通过海量驾驶数据训练模型，让算法自主学习如何驾驶。然而，数据驱动同样面临瓶颈：如果某个场景从未出现在训练数据中，系统仍然无法有效应对。例如，在高速公路上遇到施工区域，如果数据库中没有类似场景，车辆可能选择刹车甚至直接撞上去。这就是所谓的“长尾问题”——虽然大部分场景已经能够覆盖，但特殊工况下系统仍可能“宕机”。

正是基于对上述瓶颈的深刻认知，长城汽车认为，下一代智能驾驶必须走向知识驱动。知识驱动的本质是让算法体系本身具备知识，而不是仅仅依赖外部输入的数据。VLA大模型的出现，正好提供了实现这一目标的技术路径——它将人类语言中的世界知识融入智驾系统，同时通过语言理解来增强对物理世界的感知和推理能力。

VLA+世界模型：车端云端协同的技术架构

图源：演讲嘉宾素材

基于上述思考，长城汽车推出了全新的VLA技术体系，采用车端VLA大模型与云端世界模型协同的架构方案。在车端，系统通过多传感器进行空间编码，将摄像头、激光雷达等传感器的输入转化为对三维物理空间的感知表征。与此同时，文本编码模块将导航指令、互联网知识等语言信息融入大模型，形成融合语言理解与空间感知的统一知识体系。

这一架构的输出分为两个并行部分：首先是轨迹输出，即VLA模型直接生成车辆的控制指令，实现对车辆的操控；其次是思维链推导，系统将当前场景的理解、决策依据等信息通过文本解码，在屏幕上呈现给用户，增强人机交互的透明度和信任感。在最终的控制输出端，系统后端还设有一个策略层，基于安全、效率、舒适等多个维度对模型输出进行综合评估和约束，确保车辆行为既符合驾驶意图，又满足工程可靠性要求。

技术赋能：听得懂、看得见、会思考、可信任的产品体验

在用户体验层面，长城汽车将VLA技术能力转化为四个核心产品价值主张。第一是“听得懂”。智能汽车被认为是具身智能的第一站，而人与汽车最自然的交互媒介就是语言。长城汽车从用户日常驾驶中的高频场景出发，让VLA模型学习并理解“前方左转”“开快一点”“开慢一点”等自然语言指令，使汽车真正能够听懂驾驶员的意图。

第二是“看得见”。VLA模型不仅要理解摄像头拍摄的图像，还要理解激光雷达等传感器采集的三维空间信息，能够准确识别当前场景中的物体、道路边界、障碍物等要素，判断应该规避什么、应该沿着哪条路径行驶。这是实现安全驾驶的基础感知能力。

第三是“会思考”。这是VLA相较于前两代算法最核心的跃升。长城汽车的VLA方案能够让汽车具备类人的推理和决策能力——看到泥泞路面会主动放慢速度，知道这里不能开快；遇到狭窄小路也会调整车速，判断谨慎通过。这种“思考”能力的来源，是让模型学习大量人类驾驶员在不同场景下的决策逻辑和应对策略，而非简单的场景记忆。

第四是“可信任”。当车辆听得懂、看得见、会思考之后，最终要赢得驾驶员的信任。这种信任一方面来自系统性能的持续提升——越来越多的复杂场景被有效应对；另一方面来自交互透明度的增强——长城汽车在车内显示屏上实现了思维链的可视化呈现，通过图像标注和文字提示，告诉用户当前场景中哪些因素在影响驾驶决策、系统为什么选择减速或加速，让用户能够理解车辆的“想法”，从而建立深层次的安心感。

行业愿景：技术赋能体验，让每一代产品实现体验跃升

长城汽车始终认为，技术的价值最终要体现在用户体验的改善上。在规则驱动时代，用户对智驾的感知是“能用”——高频场景被逐一覆盖，但体验并不连续。在数据驱动时代，凭借数百万辆量产车的数据回收和模型训练，用户开始“敢用”系统，但面对未见过的场景仍会心存疑虑。而在知识驱动时代，借助VLA大模型和世界模型的知识注入，系统的泛化能力和场景适应能力大幅提升，用户的体验目标将跃升为“好用”和“想用”——不仅能力更强，而且行为更接近人类驾驶员的判断，交互过程更自然、更可预期。

长城汽车在智能驾驶领域已深耕十余年，拥有深厚的技术积累和庞大的量产数据资源。面向未来，长城汽车将继续沿着VLA技术路线坚定推进，持续探索语言知识、空间智能与世界模型的深度融合，让智能驾驶真正成为用户出行中值得信赖的伙伴。

关于长城汽车

长城汽车是全球知名的SUV和皮卡制造企业，已于2003年、2011年分别在香港和内地上市。长城汽车旗下拥有哈弗、魏牌、欧拉、坦克及长城皮卡等品牌，产品涵盖SUV、轿车、皮卡及新能源汽车等多个品类，产销网络覆盖全球多个国家和地区。在智能驾驶领域，长城汽车坚持全栈自研与开放合作并举，持续推动AI技术在量产车型中的创新应用，致力于为全球用户提供更安全、更智能的出行解决方案。

（以上内容来自长城汽车智能驾驶产品资深专家陈龙先生于2026年06月17日第九届智能驾驶与出海大会发表的题为《AI 应用上车加速度：长城汽车VLA实践与探索》的演讲。文中提到的“智能驾驶”技术为辅助驾驶系统，不能完全替代驾驶员。驾驶员在任何时候均需保持对车辆的监控，并做好随时接管车辆的准备，请严格遵守交通法规。）

本文地址：https://auto.gasgoo.com/news/202606/23I70462897C106.shtml

好文章，需要你的鼓励