采购项目

作为采购商，我可以：

在线发布采购项目，招募精准供应商
3个工作日后，获取由盖世汽车整理的供应商清单

作为供应商，我可以：

获取配套商机，在线申请采购项目
完善公司资料，让采购商深入了解我的生产能力

去看看 >
配套企业库
销量查询
盖世汽车社区
盖世大学堂
盖亚系统
盖世汽车APP

寻求
报道
公众号
扫码关注
为你推送最新、最有料的汽车行业资讯新闻
1. 盖世汽车社区
2. 盖世汽车每日速递
APP
汽车从业人员必备工具
7*24小时专业陪伴，助力职业成长
扫码下载APP 即刻体验
企业库
销量
查询
采购
项目
用户
反馈

当前位置：首页 > 车企 > 正文

小米发布Xiaomi OneVL：一步式潜空间语言视觉推理框架

盖世汽车 Maggie 2026-05-14 09:41:46 小米

盖世汽车获悉，5月13日，小米正式发布Xiaomi OneVL，这是一个面向自动驾驶的一步式潜空间语言视觉推理框架。该框架首次将VLA模型、世界模型与潜空间推理等多条技术路线整合到同一体系下，在保持强大推理能力的同时，显著提升了推理速度与精度。

小米发布Xiaomi OneVL：一步式潜空间语言视觉推理框架

图片来源：@小米技术

据介绍，Xiaomi OneVL采用了“语言推理+视觉未来预测”的双重监督机制，将可解释性与世界模型的未来预测能力共同融入潜空间推理过程。

其核心思路在于：自动驾驶所需压缩的信息并非仅限于语言层面的推理，而是对未来视觉世界变化的整体理解。驾驶决策更多依赖于车辆运动、道路几何、障碍物演变等时空因果关系，单纯压缩语言可能会丢失关键结构信息，而压缩对未来视觉画面的预测则能更有效地保留影响驾驶结果的核心要素。

基于这一思路，小米提出了三项关键技术，核心思路是让模型在内部以自身“语言”进行思考，学习预测未来视觉画面，并将整个推理链条压缩至一步完成。在多个主流推理与规划基准测试中，Xiaomi OneVL全面刷新了现有潜空间推理方法的性能记录，其精度超越显式思维链（CoT）方法，速度则与“仅答案”预测模式相当。

小米集团雷军表示，该模型及代码将全面开源，欢迎全球开发者与研究人员共同参与，推动自动驾驶大模型的进一步发展。

*版权声明：本文为盖世汽车原创文章，如欲转载请遵守转载说明相关规定。违反转载说明者，盖世汽车将依法追究其法律责任!

本文地址：https://auto.gasgoo.com/news/202605/14I70457748C109.shtml

0

好文章，需要你的鼓励

微信扫一扫分享该文章

0

点击收藏该文章

外资Tier1们，密集涌向具身智能

24小时热文

更多企业>相关企业

联系我们

联系邮箱：info@gasgoo.com
求职应聘：021-39197800-8035
简历投递：zhaopin@gasgoo.com
客服微信：gasgoo12 (豆豆)
合作电话

新闻热线：021-39586122
商务合作：021-39586681
市场合作：021-39197800-8032
研究院项目咨询：021-39197921
站内导航

盖世汽车社区盖世大学堂-公开课英文资讯站热门内容数据报告盖世汽车产业大数据
关于盖世
盖世汽车APP下载

增值电信业务经营许可证沪B2-2007118 沪ICP备07023350号沪公网安备 31011402009699号版权所有2011|未经授权禁止复制或建立镜像，否则将追究法律责任。