• 采购项目
  • 配套企业库
  • 销量查询
  • 盖世汽车社区
  • 盖世大学堂
  • 盖亚系统
  • 盖世汽车APP
  • 汽车出海新书发布
  • 2026金辑奖申报
  • 2026具身智能产业场景融合大会
  • 2026中国汽车低碳与可持续发展论坛暨高能效技术与新材料论坛
  • 2026第八届AI智能座舱大会
  • 走进长城“同源共链”创新技术展
  • 2026走进一汽解放商用车创新技术交流会
  • 走进江汽集团 高端新能源供应链技术交流研讨会
当前位置:首页 > 活动 > 正文

华为:构筑智能汽车大模型的算力根基

盖世直播 陈琳铃 2026-06-18 14:22:06

当前,智能驾驶辅助技术快速普及,新能源车型智驾渗透率持续走高,模型、数据、训练节奏全面升级,算力已然成为车企竞争的核心焦点。行业正从L2+逐步向L3、L4乃至L5阶段演进,技术路线也从传统模型过渡到端到端、VLA及世界模型,对算力规模、数据体量、集群调度能力提出断崖式提升,同时行业还面临数据挖掘、标注、路测验证三大现实难题。

2026年6月17日,在第九届智能驾驶与出海大会上,华为技术有限公司智驾解决方案专家黄梓亮介绍到,华为依托昇腾AI打造全栈算力底座,凭借自研芯片、服务器、超节点集群构建多层次算力产品矩阵,通过架构创新、芯片迭代实现高性能与高稳定性。凭借Driving SDK、工具链及大模型能力,覆盖数据处理、模型训练、仿真、端侧部署全流程,并已落地多个实践案例,为智能汽车大模型发展筑牢算力根基。

华为:构筑智能汽车大模型的算力根基

黄梓亮|华为技术有限公司智驾解决方案专家

以下为演讲内容整理:

智能驾驶业务趋势

随着技术的快速发展,新能源智驾渗透率将达到95%,由此带来了一系列新变化。模型参数已演进至B级,训练数据规模提升至PB级/天,采集模式与采集规模均发生了显著变化,训练节奏不断加快,逐步演进至天级。头部厂商的智驾效果处于领先地位,华为乾崑智驾ADS与特斯拉FSD在算力方面投入巨大,引领着整个技术的演进。

华为:构筑智能汽车大模型的算力根基

图源:演讲嘉宾素材

从智驾发展趋势与车企自研战略来看,当前仍处于L2+至L2.9阶段,未来1-5年有望突破L3,5-10年可实现L4,L5的真正落地预计需要20年。在自动驾驶的演进过程中,算力与智驾团队的投入是关键所在,也是车企自研战略选择的重要考量因素。

智驾的持续演进,在算力规模、网络性能及训推效率方面的需求均实现了显著提升。从E2E到VLA世界模型,技术路线发生了根本转变。E2E以模仿学习为核心,当前训练规模为万卡,数据量达百PB级,万卡AI调度能力下单任务最大可达6000卡。而VLA以理解能力为核心,已扩展至10万卡、EB级数据量,10万卡算力调度极具挑战性。

在智驾数据处理流程中,高效的数据挖掘、标注与验证是智能驾驶数据闭环的基础。当前主要面临三大挑战。一是数据挖掘。海量数据的理解与生成依赖多模态大模型,而多模态大模型又对高性能、稳定、可靠的AI算力平台提出了更高要求。二是数据标注。传统手工数据标注的准确性与一致性较差,已无法满足端到端智驾算法的需求。三是路测验证。路测难以覆盖危险场景,部分极端工况需具备高性能仿真场景生成能力,以提升整体测试覆盖率。

智驾大算力集群的建设与使用,对架构效率、调度及生态提出了更高要求。集群规模从百卡、千卡扩展至万卡,训练效率随之提升,模型参数从百万级发展至十亿级、千亿级。多元算力方面,不同架构的NPU与GPU需实现统一调度,以提高整体效能。此外,在开源开放层面,新模型、新算子需更快速地适配,充分发挥其性能。

华为AI能力

昇腾AI聚焦算力底座,打造开放领先的AI基础软硬件。对标友商,昇腾AI在以下方面具备优势:一是友好支持业界开源社区与项目;二是构筑与昇腾亲和的自研应用工具链,进行应用使能并全量开源。CANN架构对标CUDA架构,自去年起已全面开源开放,助力客户与伙伴充分释放底层深层硬件能力。华为始终坚持硬件变现,做软件旨在帮助用户用好硬件。昇腾产品形态丰富,持续创新演进,为车企构筑算力底座。

集群层面,我们有Atlas 900 A3,同时具备更大规模的Atlas SuperCloud超节点。训推服务器方面,我们有Atlas 800I A3和Atlas 800 A2,均可支持大模型训练及多模态推理。视觉推理方面,我们有Atlas300I A2推理卡,其算力在各领域均处于领先水平。

华为:构筑智能汽车大模型的算力根基

图源:演讲嘉宾素材

从芯片到系统再到集群,我们重新定义了整个计算架构,打造系统级竞争力,实现算力规模领先。芯片架构上,通过面积换算力、堆叠换能力,实现算力与功能的领先。系统架构上,打破以CPU为中心的传统,改变了传统主从式计算架构。集群创新上,以整个数据中心为一台计算机,集成华为在网络、计算、存储、液冷等方面的硬件工程能力,实现大规模算力落地的应用领先。

昇腾芯片基于自研NPU,一年一迭代,匹配智驾性能与应用需求。2026年发布的950系列,支持低精度数据格式训推,提升上量能力,支持SIMD+SIMT,提升互联带宽。2027年将推出960,2028年将推出970,持续提升算力、内存带宽和内存容量,提升训练/推理性能。

昇腾NPU始终保持架构领先,从“矩阵+向量”演进至“矩阵+向量+线程+CCU”,匹配AI特征的快速发展,为智驾提供更优性能。智驾大模型训练涉及复杂多维并行,昇腾可提供超大带宽,降低通信开销。

强化学习涉及多模型多阶段,唯有超节点大规模算力方能满足带宽与显存要求。相比传统节点,新超节点在训推吞吐效率上可提升至传统集群的3倍以上,成本节省50%。

智能汽车AI解决方案

从基础设施层到计算能力,再到L0基础大模型、L1智驾大模型,直至智驾研发工具链,华为在核心业务流程中全面赋能智驾业务场景。通过提供工具SDK,以易用工具助力开发与迁移。借助盘古模型赋能及2012专家库支持,在场景理解、多模态检索、预标注、仿真场景、数据处理等场景中,效率均提升至60%。

计算能力方面,通过全自研、自主可控的昇腾AI芯片,华为为自动驾驶提供澎湃计算能力。通过集成华为ICT数字中心赋能,实现功能可拓展与快速适配,覆盖智驾、具身智能及重工领域,打破数据与AI资源管理边界。

在智驾训练、标注、脱敏、云端辅助端推理的全业务流程中,昇腾AI算力可支持多模态理解推理与传统模型推理,适配VLA大模型参数量持续增大的需求,支持多模态生成推理。云端推理层面,支持多模态理解生成,参数规模可达千亿级。

华为:构筑智能汽车大模型的算力根基

图源:演讲嘉宾素材

数据处理方面,昇腾推理支持主流大模型,在云助端数据挖掘与标注上实现开箱即用。数据标签提取、数据标注、云助端等多场景,均依托MindIE等主流推理引擎,做到开箱即用。同时已适配Qwen、Intern等30家多模态理解与生成模型,性能可达50至60,高于友商。

模型训练方面,我们推出了昇腾智驾开发套件Driving SDK,诚邀各方共建创新生态。Driving SDK基于昇腾NPU构建,涵盖50+主流大模型和50+主流算子,可实现极致简易的应用。Driving SDK覆盖主流感知规控及E2E算法,典型模型性能持平/优于业界。此外,全面支持主流多模态大模型,为智驾VLA、数据闭环提供训练加速。统一部署方面,通过格式转换,昇腾可兼容不同端侧车端软硬件,支持昇腾到昇腾、昇腾到地平线、昇腾到黑芝麻、昇腾到英伟达等多种部署方案。

实践案例

基于大规模集群支持千亿级参数、40天长稳训练,95%的故障可在10分钟内快速恢复。通过全栈故障模式库,95%的故障可实现分钟级感知,三级故障快恢策略下,70%的场景可原地无感恢复,支持无感断点续训,持续提升效率。

我们完成了数据服务、标注服务、仿真服务,覆盖多模态数据融合、海量数据处理、大模型助力高效标注及大模型3D仿真重建。在云助端场景中,面向潮汐车道理解、标记牌识别、异形车位识别等任务,时延敏感场景可做到小于1秒,时延不敏感场景可做到1-5秒,实测数据约1.5秒。此外,助力乾崑智驾打造完整数据闭环系统,提供业界领先的智能驾驶体验。

今年4月,我们发布的ADS 5采用WEWA2.0架构,本质为面向自动驾驶AI智能体的世界引擎,包含世界模型与行为模型。云端世界引擎引入多智能体博弈强化学习,从单车博弈演进至群体博弈,学习效率提升10倍。车端世界行为模型引入安全风险场,首创防御性驾驶,碰撞风险降低50%。

华为提供60 EFlops集群算力规模,训练数据达10亿公里,迭代频次仅需4天。依托超10万卡超大规模集群及全栈AI技术、全栈模型与算子库,通过稳定架构支撑市面170万辆车智驾发放稳定运行。同时助力外部客户打造高性能、高可用智驾多元平台。

面对客户的国产化算力储备2000PFLOPS及集群训练稳定性要求,我们实现每月一次MTTR小于10分钟。针对定位难、数据分析难等问题,通过智驾生成整体解决方案,提供A3超节点及存储产品线SFS Turbo数据存储,最终实现客户VLA及行泊一体模型的训练。

(以上内容来自华为技术有限公司智驾解决方案专家黄梓亮于2026年6月17日-18日在第九届智能驾驶与出海大会发表的《构筑智能汽车大模型的算力根基》主题演讲。)

本文地址:https://auto.gasgoo.com/news/202606/18I70462413C106.shtml

 
0

好文章,需要你的鼓励

微信扫一扫分享该文章