盖世汽车讯 据外媒报道,中国北京大学(Peking University)与清华大学(Tsinghua University)的研究人员发表了一篇论文,介绍“用于驾驶的生成式预训练版本1(Generative Pre-training for Driving version 1,GPD-1)”的创新框架,旨在提升自动驾驶系统的能力。该方法对各种驾驶场景进行建模,以简化场景生成、运动规划和交通仿真等任务,从而提升自动驾驶车辆预测和模拟各种驾驶条件的能力。利用分层位置编码和矢量量化自动编码器等先进创新技术,GPD-1实现了此次技术集成。
GPD-1(图片来源:azoai.com)
自动驾驶技术领域的进展
近年来,自动驾驶领域取得了显著进展,主要归功于人工智能(AI)和机器学习技术的进步。传统方法通常孤立地处理驾驶场景的特定方面,例如地图生成或运动预测。然而,由于驾驶环境中各种实体间互动的复杂性,将此类组件整合至一个统一的框架中仍面临着挑战。不过,通过利用大型数据集高效模拟和预测驾驶场景,研发生成式模型,特别是自回归变压器架构,提供了有发展前景的解决方案。
GPD-1:研发一个统一的生成式模型
在该篇论文中,研究人员介绍了GPD-1,一款旨在整合自动驾驶场景演变各个方面的模型。该框架采用标记来代表驾驶场景,其中包含自主车辆(ego vehicle)、代理和地图元素。利用一个自回归变压器,该框架能够按序处理此类标记,捕捉时间依赖性与空间关系,为驾驶场景提供强大的表示。此外,利用场景级注意力机制,可进一步促进帧内各标记之间的细微互动。
为了编码空间和时间信息,研究人员为自主车辆和代理标记研发了一款分层位置编码器,融合了二维(2D)位置和朝向信息。对于地图标记,采用矢量量化自动编码器(VQ-VAE)将自主车辆为中心的语义地图压缩成离散标记,有效降低复杂度,同时保持空间精确度。此种创新设计让GPD-1能够在交通仿真、场景生成、闭环仿真、地图预测和运动规划等任务中进行归纳,无需额外微调。
*特别声明:本文为技术类文章,禁止转载或大篇幅摘录!违规转载,法律必究。
本文地址:https://auto.gasgoo.com/news/202501/10I70415907C601.shtml
 
联系邮箱:info@gasgoo.com
客服QQ:531068497
求职应聘:021-39197800-8035
新闻热线:021-39586122
商务合作:021-39586681
市场合作:021-39197800-8032
研究院项目咨询:021-39197921
版权所有2011|未经授权禁止复制或建立镜像,否则将追究法律责任。
增值电信业务经营许可证 沪B2-2007118 沪ICP备07023350号