盖世汽车讯 让机器人拥有媲美人类的灵巧物件操作能力,长期以来都是机器人领域最难攻克的难题之一。像手持物体旋转、双臂协作搬运大件物品这类任务,需要不断调整接触位置、抓握姿态与运动轨迹。这类技能无论通过代码编程,还是由人类远程操控示范,都难以实现。
图片来源:纽约大学坦登工程学院
据外媒报道,纽约大学坦登工程学院(NYU Tandon)与机器人及人工智能研究所(the Robotics and AI Institute)的研究人员发现,机器人无需依靠人类示范,也能通过运动规划算法习得上述动作。该研究成果发表于《IEEE机器人与自动化快报》,还斩获了该期刊最佳论文奖。研究指出,合成训练数据的质量,远比业界以往认知的更为重要。
人类示范方式存在短板
当前主流的机器人学习系统大多采用模仿学习,即机器人复刻人类远程操控设备时做出的动作。但对于需要多点同时接触、手指频繁活动的高难度精细操作,远程操控系统很难胜任。
为突破这一局限,研究团队借助运动规划算法,在物理仿真环境中自动生成动作示范,尝试让机器人从虚拟场景中积累经验,而非单纯模仿人类。但研究人员发现了一个问题:业界常用的快速扩展随机树(RRT) 规划算法,生成的示范动作连贯性极差。
论文第一作者Huaijiang Zhu表示:“这类规划算法擅长找到可行动作方案,但每一套方案的动作都截然不同,学习系统也就无法判断究竟该模仿哪种行为。”
随机性为何会阻碍机器人学习
研究团队发现,这类算法的随机特性会产生高熵数据:即便完成同一任务,示范动作也千差万别。虽然动作多样性有助于算法探索各类可行方案,却会大幅降低模仿学习的效果。
针对该问题,研究人员设计了全新规划方案,用以生成动作更统一连贯的示范样本。其中一种方案优先保障动作朝着目标稳步推进,摒弃无序探索;另一种方案则复用预设动作库,以此减少动作差异。
高难度操作任务测试
研究人员选取两项高难度操作任务开展实验。第一项任务要求机械双臂反复变换抓握姿势,将大型圆柱体旋转180度;第二项任务由灵巧机械手在掌心转动方块,使其姿态与目标角度完全一致。
实验结果显示,即便训练数据集规模较小,基于高连贯性示范样本训练的机器人其成功率也远高于基于标准RRT生成的数据进行训练的机器人。在双臂协作任务中,优化后的系统仅依靠100组示范动作,就达到了近乎完美的表现。
研究团队还将仿真环境中训练得到的动作策略直接迁移至现实世界的硬件上,无需额外重新训练。实体双臂机器人的实际任务成功率达到90%,灵巧机械手的完成率约为62%。
对机器人领域发展的意义
该研究体现出机器人领域的一大研究趋势转变:科研人员不再将传统运动规划与机器学习视作两套独立技术,而是愈发注重二者融合。在本次研究中,规划算法相当于充当了神经网络机器人策略模型的“教师”。
这项成果也印证了人工智能领域的一条普遍规律:数据并非越多越好。相较于海量杂乱、动作差异过大的示范样本,经过精心整理、动作连贯的样本,能让机器学得更高效。
目前该领域仍存在不少挑战,尤其是针对柔性物体操作、软体机械手等场景——这类对象难以在仿真环境中精准还原。但此项研究指明了新方向:未来的虚拟仿真环境,不仅要生成可行动作方案,更要产出机器能够理解、便于学习的动作,助力机器人掌握愈发复杂的肢体操作技能。
*版权声明:本文为盖世汽车原创文章,如欲转载请遵守 转载说明 相关规定。违反转载说明者,盖世汽车将依法追究其法律责任!
本文地址:https://auto.gasgoo.com/news/202606/9I70461126C101.shtml
 
联系邮箱:info@gasgoo.com
求职应聘:021-39197800-8035
简历投递:zhaopin@gasgoo.com
客服微信:gasgoo12 (豆豆)
新闻热线:021-39586122
商务合作:021-39586681
市场合作:021-39197800-8032
研究院项目咨询:021-39197921
