采购项目

作为采购商，我可以：

在线发布采购项目，招募精准供应商
3个工作日后，获取由盖世汽车整理的供应商清单

作为供应商，我可以：

获取配套商机，在线申请采购项目
完善公司资料，让采购商深入了解我的生产能力

去看看 >
配套企业库
销量查询
盖世汽车社区
盖世大学堂
盖亚系统
盖世汽车APP

寻求
报道
公众号
扫码关注
为你推送最新、最有料的汽车行业资讯新闻
1. 盖世汽车社区
2. 盖世汽车每日速递
APP
汽车从业人员必备工具
7*24小时专业陪伴，助力职业成长
扫码下载APP 即刻体验
企业库
销量
查询
采购
项目
用户
反馈

当前位置：首页 > 新技术 > 正文

中国研究人员发明新型多模态人工智能框架为自动驾驶汽车带来类似人类的推理能力

盖世汽车刘丽婷 2025-12-12 14:52:28 前瞻技术

盖世汽车讯自动驾驶技术发展迅速，已从基于规则的系统发展到深度神经网络。然而，端到端模型仍然存在一些重大缺陷：它们通常缺乏对世界的认知，在罕见或模糊的场景下表现不佳，并且对其决策过程的解释能力有限。相比之下，大语言模型（LLM）擅长推理、理解上下文和解释复杂的指令。但是，LLM的输出是语言形式而非可执行指令，这使得将其与实际车辆控制系统集成变得困难。这些不足之处凸显了对一种框架的需求，该框架能够将多模态感知与基于既定驾驶逻辑的结构化、可执行的决策输出相结合。解决这些挑战需要深入研究如何将多模态推理与自动驾驶规划器相结合。

中国研究人员发明新型多模态人工智能框架为自动驾驶汽车带来类似人类的推理能力

图片来源：期刊《Visual Intelligence》

据外媒报道，上海交通大学、上海人工智能实验室、清华大学及合作机构的研究团队开发了一种用于闭环自动驾驶的多模态大型语言模型框架DriveMLM。相关研究成果已发表在期刊《Visual Intelligence》上（DOI: 10.1007/s44267-025-00095-w）。

DriveMLM集成了多视角摄像头图像、激光雷达点云、系统消息和用户指令，生成对齐的行为规划状态。这些状态可以直接输入到现有的运动规划模块，从而实现实时驾驶控制，同时生成对每个决策的自然语言解释。

本文共计1000字开通高级账号后继续阅读

登录后获取已开通的账号权益

*特别声明：本文为技术类文章，禁止转载或大篇幅摘录！违规转载，法律必究。

本文地址：https://auto.gasgoo.com/news/202512/12I70438862C409.shtml

0

好文章，需要你的鼓励

微信扫一扫分享该文章

0

点击收藏该文章

中国Robotaxi，与特斯拉、Waymo终有一战

24小时热文

2026的关键战，“打”在人上

联系我们

联系邮箱：info@gasgoo.com
求职应聘：021-39197800-8035
简历投递：zhaopin@gasgoo.com
客服微信：gasgoo12 (豆豆)
合作电话

新闻热线：021-39586122
商务合作：021-39586681
市场合作：021-39197800-8032
研究院项目咨询：021-39197921
站内导航

盖世汽车社区盖世大学堂-公开课英文资讯站热门内容数据报告盖世汽车产业大数据
关于盖世
盖世汽车APP下载

增值电信业务经营许可证沪B2-2007118 沪ICP备07023350号沪公网安备 31011402009699号版权所有2011|未经授权禁止复制或建立镜像，否则将追究法律责任。