• 采购项目
  • 配套企业库
  • 销量查询
  • 盖世汽车社区
  • 盖世大学堂
  • 盖亚系统
  • 盖世汽车APP
  • 斯凯孚SKF线上展示厅—2024北京车展
  • 车规级功率半导体产业研究报告 (2024版)
  • 2024中国汽车低碳与可持续发展论坛
  • 2024智能座舱车载声学大会
  • 2024第六届智能驾驶地图与定位大会
  • 2024第七届智能驾驶与人机共驾论坛
  • 汽车功能安全工程师培训
  • 智能汽车中央计算平台系统培训
  • 2024第二届吉利汽车技术论坛暨前瞻技术展
当前位置:首页 > 智能网联 > 正文

百度智能云全周期数据运营服务

盖世直播 唐吉 2023-03-30 17:06:00

大规模高质量样本数据、快速迭代优化的算法模型、高性能存储和算力资源正成为自动驾驶技术研发的核心三要素。

2023年3月15日,百度智能云数据应用业务部解决方案总监曾虹云在2023第四届软件定义汽车论坛暨AUTOSAR中国日上介绍了百度智能云自动驾驶数据闭环方案,针对原始数据获取、场景数据处理、算法训练评测等方面,分别提供车辆改装、路采、数据清洗筛选、数据标注、仿真评测等全周期的数据运营服务,助力自动驾驶技术研发。

百度智能云全周期数据运营服务

 百度智能云数据应用业务部解决方案总监曾虹云

内容根据曾虹云《百度智能云全周期数据运营服务》主题演讲整理:

自动驾驶的研发涉及三个关键要素:大规模高质量样本数据,快速迭代的算法模型,高性能存储和算力资源。百度智能云数据团队致力于为企业和算法团队提供整体的底层数据解决方案。

通常而言,数据服务过程中有三个重要环节:获取有效数据、根据需求加工数据、高效使用数据,且在实际操作中会遇到许多现实问题。例如,在数据获取阶段,国家对道路数据的采集、存储、运输和加工都有严格的资质要求,业务门槛高;对于数据的加工,目前大部分数据仍然依靠人工处理和标注,标注规则不明确导致的产能低效、质量不高等问题,影响研发进度;在使用数据时,也会遇到“如何找到有价值的数据?”“如何通过自动化的方式自驱形成闭环,并指导下一步寻找数据?”等问题,效率低下。

我们绘制了一个数据闭环图,较为详尽地呈现了数据在整个自动驾驶研发过程中扮演的角色:从车端部署环节开始,首先要对车辆进行传感器标定、真值系统等改装,获取所需的场景数据;再根据需求对数据进行筛选和标注,用于算法训练;然后对算法的表现进行评测和仿真,从而推动软件迭代。

百度智能云全周期数据运营服务

图片来源:嘉宾演讲材料

接下来我会对各个板块进行展开,介绍百度智能云自动驾驶数据闭环方案提供的自动驾驶数据运营服务与自动驾驶工具链平台。百度智能云数据运营服务包括数据脱敏脱密、数据清洗、数据挖掘、数据标注、数据管理、模型训练评测、仿真测评等,自动驾驶工具链平台将这些服务整合,通过智驾数据管理平台、智能标注平台、智驾研发平台以及云仿真平台的形式为车企提供。

数据采集:法律法规限制严格

首先,如何合规合法地获取道路数据是许多企业面临的核心问题。这需要很高的门槛。因为国家对道路数据信息的采集、传输和管理都有明确的要求。我简单介绍一些数据采集的流程规定:

第一,数据处理必须在完全物理隔绝且不能上网、上云端的合规编译室内进行。 第二,合规编译室必须由具有甲级测绘资质的图商负责运营和监管。 第三,在使用数据时,必须经过脱密和脱敏处理。

百度作为一家拥有甲级资质的图商,可以提供数据采集流程建议,并帮助客户在中国境内合法合规地获取算法研发所需要的道路数据。

数据管理:高效挖掘、调取数据是关键

数据应用过程的主要问题在于数据的清晰化管理,比如百度采取的就是分场景存储的方式,方便调取不同数据。我们观察到,其实包括百度在内的很多企业已有大量数据(如百度已有3000万公里),问题就在于如何在已有数据中高效找到所需数据。

百度会提供大量筛选模型和技术人员,帮助客户根据各自场景化要求筛选合适数据。我展开介绍下百度智能云自动驾驶工具链智驾管理平台使用最多的两个功能——数据处理工艺和场景挖掘能力。

百度智能云全周期数据运营服务

图片来源:嘉宾演讲材料

覆盖多场景的数据处理工艺包括数据清洗、数据处理和挖掘三大环节。首先将实现原始采集数据的清洗,包括但不限于图像/点云模糊、内容失真等图片或点云进行清洗剔除;支持自定义传感器类型的数据处理流程,如2D相机的前视角、纯激光雷达点云数据、2D&3D融合数据;利用AI算法,实现在线目标检测、场景挖掘等,深度挖掘高价值数据标签。

接下来是场景挖掘中的静态动态全栈能力,百度支持20大类场景算法挖掘,上千种小类的场景算法挖掘,满足多数算法团队和主机厂提出的诉求,希望以更高效、低成本方式持续找到所需数据。

数据标注:面临高效、高质、安全三大痛点

对于筛选到的数据,需要进行大量标注。尽管自动化标注和无监督学习技术正在应用于数据标注行业,但由于目前各家的传感器系统、训练场景、标注规则差异较大,仍需依赖大量的人工标注作业,这就对人力的充裕程度和操作经验提出了很高的要求。

“效率是否够快,质量是否够好,数据是否安全”是所有客户都会担忧的三大痛点,针对这三个痛点,百度智能云也给出了相应的解决方案:

第一,在全国各地与政府共建数据标注基地,使人力资源可控、可培训、可管理。第二,通过内部自动化流程和算法技术支持,确保数据标注质量。第三,提供网络安全和私有化部署,确保客户数据不出服务器,把好安全关。

除了提供专业、稳定的人工数据标注服务,百度智能云也为客户提供一套完整的数据标注平台,能够进行点云、图片等多类型数据标注,实时评估标注质量。其中的智能标注工具链可平均提高20-40%标注效率,若基于稳定的感知系统和标注规则,标准效率和准确率都会大幅提升。

仿真评测:海量场景库支撑算法验证

百度智能云自动驾驶数据闭环方案也提供模型训练调优服务,包括资源调度+评测方法,提供各个维度的报告,可以帮助客户定位当前模型优劣。最后是仿真场景库建设服务,百度不提供仿真引擎,但基于积累的海量场景库和不同算法模型,帮助客户根据规则和场景信息构建大量仿真数据,进行仿真应用验证和数据迭代。

以上就是百度智能云自动驾驶数据闭环方案,包括我们为企业提供的自动驾驶数据运营服务,以及自动驾驶工具链平台,帮助企业建立一套自动驾驶的数据闭环,助力企业加速自动驾驶研发进程。

本文地址:https://auto.gasgoo.com/news/202303/30I70335859C601.shtml

 
0

好文章,需要你的鼓励

微信扫一扫分享该文章