专栏中心

EEPW首页 > 专栏 > 智能驾驶感知算法的演进

智能驾驶感知算法的演进

发布人：地平线开发者时间：2026-04-07 来源：工程师

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

发布文章

从 2D 感知到 BEV 世界模型

一、问题的本质：自动驾驶究竟要“理解”什么

智能驾驶中的感知算法，并不是单纯回答“画面里有什么”，而是要回答三个更困难的问题：

世界在三维空间中是什么样的
不同传感器看到的是否是同一个世界
这个世界在时间维度上如何连续变化

早期感知算法的发展，很长一段时间都停留在“看清楚图像内容”，而不是“理解真实世界结构”。 BEV（Bird’s Eye View）路线的出现，本质上是一场从图像认知到世界建模的范式迁移。

二、2D Image-space 感知：从“能识别”开始，但止步于图像1.典型范式

最早一代智驾感知算法几乎全部工作在 Image-space：

输入：单目或多目 RGB 图像
输出：2D bounding box、2D segmentation mask
核心任务：检测车辆、行人、交通标志

这一阶段的算法高度继承了通用计算机视觉的发展成果，如 Faster R-CNN、YOLO、Mask R-CNN 等。

2.这一代真正解决了什么问题

2D 感知第一次让自动驾驶系统具备了“看懂画面”的能力：

能稳定识别物体类别
能在复杂背景中找到关键目标
能在消费级算力上实时运行

这是必要的一步，没有这一代，后续所有感知算法都无从谈起。

3.根本性缺陷

Image-space 感知存在无法通过模型规模解决的结构性问题：

没有真实几何
多相机之间缺乏统一坐标系
所有空间关系只是投影结果

Image-space 感知并不真正理解世界，而是在理解像素。

三、LiDAR-first 时代：几何优先，但语义不足1.点云带来的改变

LiDAR 的引入让感知系统第一次拥有真实三维信息：

点云天然位于世界坐标系
距离、尺寸、位置无需推测
3D Box 成为可能

VoxelNet、PointPillars、SparseConv 等方法逐渐成为主流。

2.解决的关键问题

准确的空间几何
稳定的目标定位
易于与规划模块对接

在空间可信度上，LiDAR-first 路线显著优于纯视觉。

3.局限性

成本与功耗高
点云语义信息稀疏
视觉信息利用不足

单一传感器难以同时满足几何与语义需求。

四、BEV：统一世界坐标系的关键一步

BEV（Bird’s Eye View）不是一种模型，而是一种世界表示方式：

所有感知结果统一到俯视视角
多相机天然对齐
空间关系直观，利于规划与预测

BEV 的出现，标志着感知开始围绕“决策友好性”设计。

1.第一代 BEV 的实现方式

早期 BEV 依赖显式几何：

深度估计
相机标定
投影矩阵

通过 image → depth → world → BEV 的方式完成映射。

2.暴露的问题

深度误差被放大
对噪声极其敏感
单帧 BEV 抖动明显

问题不在 BEV，而在从 image 到 BEV 的方式。

五、BEVFormer：让模型学习投影关系

BEVFormer 的核心思想是：

不再显式计算深度，而是让模型学习 BEV 与图像之间的对应关系。

1.核心机制

BEV Query：BEV 空间中的查询点
Spatial Cross-Attention：BEV 与多相机特征交互
Temporal Self-Attention：引入历史 BEV

2.带来的突破

摆脱显式深度建模
自动学习复杂投影关系
时序建模提升稳定性

BEVFormer 让 camera-only BEV 感知在精度上具备竞争力。

3.新问题

Transformer 计算复杂
显存与算力消耗大
工程部署成本高

BEVFormer 是算法正确性的高峰，但也引入了工程压力。

六、BEVFusion：多模态 BEV 的系统化尝试1.出发点

Camera 语义强但几何不稳，LiDAR 几何稳但语义弱。

BEVFusion 试图在 BEV 空间融合两者优势。

2.核心思想

Camera → BEV
LiDAR → BEV
在 BEV 空间完成融合

3.优势

几何稳定性提升
多模态互补自然
极端场景鲁棒性更强

4.代价

模型结构复杂
多分支系统维护成本高
推理链路变长

BEVFusion 提升了系统完整性，但工程复杂度显著上升。

七、Sparse4D：向现实系统妥协的 BEV1.核心判断

Dense BEV 中，大多数网格并无有效信息，计算存在浪费。

2.核心变化

Dense BEV → Sparse 表示
空间建模 → Object-centric 建模
强调时序一致性

3.解决的问题

显著降低计算量
更易满足实时性
更接近可部署系统需求

4.取舍

全局建模能力下降
更依赖 tracking 与初始化
系统设计复杂度提升

Sparse4D 是工程理性下的选择。

八、数据与传感器：算法演进的真正推手1.数据集演进

单帧 → 长时序
单传感器 → 多模态
公共数据 → 私有闭环

数据形态直接塑造算法结构。

2.传感器现实约束

Camera 数量增加
LiDAR 成本博弈
Radar 作为补充角色

这些现实因素持续影响 BEV 路线的取舍。

九、结语：BEV 是基础设施，而不是终点

BEV 的意义不在于某个具体模型，而在于：

自动驾驶系统第一次拥有了统一的世界表示。

未来模型名称可能变化，但在世界坐标系中建模、在时间维度中理解世界，将成为不可逆的方向。

专栏文章内容及配图由作者撰写发布，仅供工程师学习之用，如有侵权或者其他违规问题，请联系本站处理。联系我们

关键词：算法 自动驾驶 算法工具链 地平线 征程5

加密算法之MD5算法

加密算法之MD5算法...

资源下载加密算法加密算法 MD5算法 2007-02-16

数字PID控制算法之一

数字PID控制算法之一...

资源下载 PID PID控制算法 2007-12-28

PID算法

PID算法...

资源下载 PID 算法误差 2007-02-16

[转帖]us/os就绪表的维护算法分析

amine 2002-05-17

76-81GHz自动驾驶CMOS RADAR

查看我们创新型高度集成式28nm CMOS RADAR雷达解决方案的系统级演示，该方案将角分辨率指数级升高，以支持面向OEM、一级厂商、创业公司和颠覆性初创公司的高度自动化的驾驶应用。了解有关汽车解决方案的更多信息...

视频 ADI 自动驾驶 CMOS RADAR 2018-05-31

自动驾驶的现状与未来（节选）

在本节选视频中，ADI公司自动交通和汽车安全副总裁Chris Jacobs探讨自动驾驶的现状和未来，及其对社会的影响。...

视频 ADI 自动驾驶 2020-03-16

采用Mean-Shift和Camshift算法相结合的火焰视频图像跟踪设计

设计方案采用 Mean-Shift Camshift 算法相结合 2011-06-27

简单实用的单片机CRC 快速算法

提供两个实用的、能够在单片机上通过软件来实现的CRC 快速算法，其中一个适用于51 系列等单片机，另一个适用于PIC 单片机，这两种算法十分简单快捷。...

资源下载 CRC 算法单片机 2007-02-16

恩智浦第三代雷达收发器助力高性能成像雷达规模量产，赋能L2+至L4级自动驾驶

采用RFCMOS工艺的汽车雷达收发器，集成8个发射通道和8个接收通道，助力实现多达576个天线通道的新一代成像雷达传感器，全面服务高级驾驶辅助系统（ADAS）和自动驾驶应用。最新动态恩智浦半导体（NXP Se...

汽车电子恩智浦雷达收发器成像雷达自动驾驶 2026-03-27

CRC算法原理及C语言实现

本文从理论上推导出CRC算法实现原理，给出三种分别适应不同计算机或微控制器硬件环境的C语言程序。读者更能根据本算法原理，用不同的语言编写出独特风格更加实用的CRC计算程序。...

资源下载 CRC 算法 C语言 2007-02-16

实时训练驾驶人工智能

自动驾驶是物理 AI 领域难度最高的问题之一。自动驾驶系统必须实时解读混乱、动态变化的环境，应对不确定性、预测人类行为，并在海量场景与极端工况下安全运行。在通用汽车，我们的出发点很简单：道路上绝大多数场景都是可预测的，但...

汽车电子自动驾驶物理 AI 多智能体强化学习模拟器 GM 2026-03-31

日产联手优步与 Wayve，计划在东京推出自动驾驶出租车服务

日产、优步（Uber）与 Wayve 将展开合作，计划今年在东京街头投放自动驾驶出租车。该项目将采用日产聆风（Nissan Leaf）纯电动车，搭载 Wayve 公司的高级驾驶辅助系统（ADAS）技术。Wayve 首席执...

汽车电子日产优步 Wayve 东京自动驾驶出租车 2026-03-16

基于LPC2138的血压测量算法开发平台电路图

设计方案基于 LPC2138 血压测量算法开发平台电路图 2010-01-20

ZF与SiliconAuto推出用于自动驾驶的实时I/O芯片

ZF 与 SiliconAuto 发布了一款全新芯片架构，旨在简化自动驾驶高性能计算。两家公司在 2026 德国嵌入式展会（embedded world 2026）上，展示了这款实时 I/O 接口芯片搭配微控制器的方案，...

汽车电子 ZF SiliconAuto SoC ADAS 自动驾驶芯片 2026-03-16

为什么可扩展高性能 SoC 是自动驾驶汽车的未来

总结在中央计算平台的帮助下，汽车行业的自动驾驶水平越来越高。TDA5 系列等 SoC 通过集成式 C7™ NPU 和芯片就绪型设计提供安全、高效的 AI 性能。这些 SoC 使汽车制造商能够更轻松地实现 ADAS ...

汽车电子 SoC 自动驾驶 2026-03-06

赋能自动驾驶和机器人感知，读懂二维可寻址VCSEL | 硬科技有点意思

你是否想过，深夜奔驰在高速公路上的智能汽车，如何精准识别侧后方突然逼近的车辆？或者，你家中的扫地机器人，又是如何在桌椅腿丛林中灵活穿梭，不碰倒一杯水？这背后，都离不开一项被称为机器“眼睛”的核心技术——激光雷达。而激光雷...

机器人 VCSEL 自动驾驶具身智能 2026-03-20

携手ADI赢得未来

从自动驾驶到医疗健康，我们的客户能够利用相关数据和核心见解展开创新。我们将现实世界转化为可操作的见解，从而不断推动客户实现行业变革。...

视频 ADI 自动驾驶医疗健康 2019-11-08

vxwokrs下静态图像压缩算法（上）

C-- 2004-07-26

英伟达宣布与比亚迪、吉利展开自动驾驶业务合作

在美国加州圣何塞举行的2026年GTC大会上，英伟达宣布将自动驾驶汽车开发业务合作拓展至现代汽车、日产汽车、五十铃汽车，以及中国车企比亚迪与吉利。新合作围绕英伟达「Drive Hyperion」自动驾驶平台展开，该系统助...

英伟达比亚迪吉利自动驾驶 2026-03-17

ADI：传感技术助力未来自动驾驶的发展

ADI公司自动驾驶和汽车安全部副总裁Chris Jacobs介绍ADI的传感技术如何助力未来自动驾驶的发展，以及自动驾驶技术如何造福社会和挽救生命。...

视频 ADI 自动驾驶 2020-03-16

采埃孚与SiliconAuto推出自动驾驶实时I/O接口芯片

采埃孚（ZF）与 SiliconAuto 共同发布了一款全新芯片架构，旨在简化自动驾驶高性能计算。两家公司在德国纽伦堡举办的Embedded World 2026展会上，展示了这款实时 I/O 接口芯片与微控制器的组合方...

汽车电子采埃孚 ZF SiliconAuto 自动驾驶实时I/O 接口芯片 2026-03-16

目标跟踪算法在红外热成像跟踪技术上的应用

设计方案目标跟踪算法红外成像技术上应用 2009-09-03

加快实现自动驾驶（完整小组讨论）

汽车行业正在经历数字化转型，需要处理自动驾驶化方面极为复杂的创新。观看专家小组讨论的视频，其中包括ADI公司自动驾驶和安全事业部副总裁Chris Jacobs。...

视频 ADI 自动驾驶 2020-06-12

数字PID控制及其改进算法的应用

设计方案数字控制及其改进算法应用 2011-05-11

计算机科学与技术反思录(2)

liujt_ic 2003-06-06

英伟达 “全天候” 芯片实现毫秒级人脸检测

全天候视觉系统可应用于自动驾驶汽车、机器人，或帮助消费电子设备在无人时关闭屏幕以节省功耗。但要实现这类应用，这些系统必须最大限度降低自身功耗。英伟达研究人员开发的全天候计算机视觉系统可在不到 1 毫秒内检测到人脸。这款人...

汽车电子英伟达人脸识别视觉处理自动驾驶机器人 2026-03-24

地平线HSD引领智能驾驶普惠新时代

简介作为国内首发一段式端到端大模型的全场景辅助驾驶系统，HSD以地平线征程芯片为核心技术支撑，构建起覆盖城区、高速、乡间小路、停车场的全场景适配能力。在连续弯道、多出口大型环岛等复杂道路拓扑环境中，能实现精准感知与丝滑通...

汽车电子地平线 HSD 多维具身智能计算平台机器人 2026-03-24

无线传感器网络低功耗分簇路由算法设计

设计方案无线传感器网络功耗路由算法设计 2012-09-07

有关指纹算法

wsf999 2004-08-06

求FSK信号的解调算法，主要是铁路上的移频信号!

dhlwq007 2004-08-04

更多 培训课堂

更多焦点

更多视频