• 采购项目
  • 配套企业库
  • 销量查询
  • 盖世汽车社区
  • 盖世大学堂
  • 盖亚系统
  • 盖世汽车APP
  • 汽车出海新书发布
  • 粤港澳大湾区智能汽车技术协同及采购对接会
  • 2026第九届智能驾驶大会
  • 2026未来商用车及专用车技术与产业大会暨CSAE汽车智能交通分会
  • 2026第八届AI智能座舱大会
当前位置:首页 > 车企 > 正文

小米发布Xiaomi OneVL:一步式潜空间语言视觉推理框架

盖世汽车 Maggie 2026-05-14 09:41:46 小米

盖世汽车获悉,5月13日,小米正式发布Xiaomi OneVL,这是一个面向自动驾驶的一步式潜空间语言视觉推理框架。该框架首次将VLA模型、世界模型与潜空间推理等多条技术路线整合到同一体系下,在保持强大推理能力的同时,显著提升了推理速度与精度。

小米发布Xiaomi OneVL:一步式潜空间语言视觉推理框架

图片来源:@小米技术

据介绍,Xiaomi OneVL采用了“语言推理+视觉未来预测”的双重监督机制,将可解释性与世界模型的未来预测能力共同融入潜空间推理过程。

其核心思路在于:自动驾驶所需压缩的信息并非仅限于语言层面的推理,而是对未来视觉世界变化的整体理解。驾驶决策更多依赖于车辆运动、道路几何、障碍物演变等时空因果关系,单纯压缩语言可能会丢失关键结构信息,而压缩对未来视觉画面的预测则能更有效地保留影响驾驶结果的核心要素。

基于这一思路,小米提出了三项关键技术,核心思路是让模型在内部以自身“语言”进行思考,学习预测未来视觉画面,并将整个推理链条压缩至一步完成。在多个主流推理与规划基准测试中,Xiaomi OneVL全面刷新了现有潜空间推理方法的性能记录,其精度超越显式思维链(CoT)方法,速度则与“仅答案”预测模式相当。

小米集团雷军表示,该模型及代码将全面开源,欢迎全球开发者与研究人员共同参与,推动自动驾驶大模型的进一步发展。

*版权声明:本文为盖世汽车原创文章,如欲转载请遵守 转载说明 相关规定。违反转载说明者,盖世汽车将依法追究其法律责任!

本文地址:https://auto.gasgoo.com/news/202605/14I70457748C109.shtml

 
0

好文章,需要你的鼓励

微信扫一扫分享该文章