• 采购项目
  • 配套企业库
  • 销量查询
  • 盖世汽车社区
  • 盖世大学堂
  • 盖亚系统
  • 盖世汽车APP
  • 汽车出海新书发布
  • 2026金辑奖申报
  • 2026第九届智能驾驶大会
  • 2026具身智能产业场景融合大会
  • 2026中国汽车低碳与可持续发展论坛暨高能效技术与新材料论坛
  • 2026第八届AI智能座舱大会
  • 走进长城“同源共链”创新技术展
  • 2026走进一汽解放商用车创新技术交流会
当前位置:首页 > 新技术 > 正文

MIT提出掩码逆强化学习算法 利用大模型赋能机器人

盖世汽车 言奇 2026-06-09 12:01:25

盖世汽车讯 设想在不久的将来,工作人员在仓库或办公室带一名新员工熟悉岗位,而这名新人是一台机器人。想要教会它工作,工作人员可以采用“边演示边讲解”的教学方式:实操演示多种作业方式,同步口述操作要点。

举例来说,工作人员让机器人把咖啡放到桌上,不能打扰正在线上开会的同事。工作人员希望机器人远离自己和笔记本电脑,避免打断会议。想要实现该效果,需要用完整任务数据训练机器人。以往科研人员要么录制大量实操演示,要么撰写详尽操作说明来教会机器人完成抓取作业;一旦缺少足量演示样本或详细文字指引,机器人极易误解任务要求。

对人类而言,这种“演示加讲解”的过程相当费时费力。据外媒报道,麻省理工学院计算机科学与人工智能实验室(Computer Science and Artificial Intelligence Laboratory, CSAIL)的研究团队实现了一种机器人教学自动化方案,这套方案可自动完善模糊指令,且所需演示数据减少了近五分之四。

研究提出掩码逆强化学习(Masked IRL)算法:依托首个大语言模型,结合人工演示数据补全语义含糊的指令;再由另一套大模型筛选关键信息,敲定需要写入运动规划的细节,让机器人能够在家庭、办公室、工厂环境中安全完成各类作业。

MIT提出掩码逆强化学习算法 利用大模型赋能机器人

图片来源:MIT CSAIL



本文共计1000字开通高级账号后继续阅读

登录后获取已开通的账号权益

本文共计1000字开通高级账号后继续阅读

您未开通,请开通后阅读

*特别声明:本文为技术类文章,禁止转载或大篇幅摘录!违规转载,法律必究。

本文地址:https://auto.gasgoo.com/news/202606/9I70461124C409.shtml

 
0

好文章,需要你的鼓励

微信扫一扫分享该文章