$VideoContentTcplayer$
盖世汽车讯 据外媒报道,美国西北大学(Northwestern University)工程师开发出专为智能机器人设计的新人工智能(AI)算法。通过帮助机器人快速、可靠地学习复杂的技能,新方法可以显著提高机器人在一系列应用中的实用性和安全性,包括自动驾驶汽车、送货无人机、家庭助理和自动化。
图片来源:西北大学
该算法被称为最大扩散强化学习(Called Maximum Diffusion Reinforcement Learning,MaxDiff RL),其成功在于它能够鼓励机器人尽可能随机地探索其环境,以获得多样化的经验。这种“设计的随机性”提高了机器人收集的有关其周围环境的数据的质量。而且,通过使用更高质量的数据,模拟机器人表现出更快、更高效的学习能力,从而提高了其整体可靠性和性能。
在与其他人工智能平台进行测试时,使用西北大学新算法的模拟机器人始终优于最先进的模型。事实上,新算法运行得非常好,机器人学会了新任务,然后在第一次尝试中成功执行。这与当前的人工智能模型形成鲜明对比,当前的人工智能模型需要通过反复试验来实现较慢的学习速度。
这项名为“最大扩散强化学习(Maximum diffusion reinforcement learning)”的相关研究发表于期刊《Nature Machine Intelligence》。
“其他人工智能框架可能有些不可靠,”领导这项研究的西北大学Thomas Berrueta表示。“有时他们会完全完成任务,但有时他们会完全失败。使用我们的框架,只要机器人能够解决任务,每次打开机器人时,用户可以期望它完全按照要求做的事情。这使得解释机器人的成功和失败变得更容易,这在日益依赖人工智能的世界中至关重要。”
Berrueta的顾问、机器人专家Todd Murphey是西北大学麦考密克工学院教授,也是该论文的资深作者。Berrueta和Murphey与同为博士生的Allison Pinosky共同撰写了这篇论文。
无形的脱节
为了训练机器学习算法,研究人员和开发人员使用大量的大数据,这些数据是人类精心过滤和整理的。人工智能从这些训练数据中学习,通过反复试验,直到达到最佳结果。虽然这个过程对于ChatGPT和Google Gemini(以前称为Bard)等非实体系统很有效,但它不适用于机器人等实体人工智能系统。相反,机器人自己收集数据,无需人类管理者的帮助。
“传统算法在两个不同的方面与机器人技术不兼容,”Todd Murphey说到。“首先,脱离实体的系统可以利用物理定律不适用的世界。其次,单次失败不会产生任何后果。对于计算机科学应用来说,唯一重要的是它在大多数情况下都是成功的。在机器人技术中,一次失败可能是灾难性的。”
为了解决这种脱节问题,Berrueta、Murphey和Pinosky旨在开发一种新颖的算法,确保机器人能够随时随地收集高质量的数据。MaxDiff RL的核心是命令机器人更加随机地移动,以收集有关其环境的全面、多样化的数据。通过自我策划的随机经验学习,机器人获得完成有用任务所需的技能。
第一次就做对
为了测试新算法,研究人员将其与当前最先进的模型进行了比较。研究人员利用计算机模拟,要求模拟机器人执行一系列标准任务。总体而言,使用MaxDiff RL的机器人比其他模型学习得更快,且可以更一致、更可靠地正确执行任务。
更令人印象深刻的是:使用MaxDiff RL方法的机器人通常可以在第一次尝试中九成功地正确执行任务。“我们的机器人更快、更敏捷,能够有效地概括所学到的知识并将其应用到新的情况中,”Berrueta表示。“对于机器人无法承受无休止的试错时间的现实应用来说,这是一个巨大的优势。”
由于MaxDiff RL是一种通用算法,因此可用于多种应用。研究人员希望它能解决阻碍该领域发展的基本问题,最终为智能机器人技术的可靠决策铺平道路。
Pinosky表示:“这不仅仅适用于四处移动的机器人车辆,也可以用于固定机器人,例如厨房中学习如何装载洗碗机的机械臂。随着任务和物理环境变得更加复杂,在学习过程中考虑体现的作用变得更加重要。”
*特别声明:本文为技术类文章,禁止转载或大篇幅摘录!违规转载,法律必究。
本文地址:https://auto.gasgoo.com/news/202405/7I70391222C409.shtml
联系邮箱:info@gasgoo.com
客服QQ:531068497
求职应聘:021-39197800-8035
新闻热线:021-39586122
商务合作:021-39586681
市场合作:021-39197800-8032
研究院项目咨询:021-39197921
版权所有2011|未经授权禁止复制或建立镜像,否则将追究法律责任。
增值电信业务经营许可证 沪B2-2007118 沪ICP备07023350号