新闻中心

EEPW首页 > 智能计算 > 设计应用 > 神经网络驱动的安全交互式车道变换规划

神经网络驱动的安全交互式车道变换规划

作者: 时间:2025-11-06 来源: 收藏

一、引言:智能驾驶的核心矛盾

的众多任务中,车道变换(Lane Changing) 一直被认为是最具挑战性的决策问题。
它涉及复杂的车辆交互、驾驶员行为预测和高动态的时空约束:稍显保守,车辆会长期滞留在车道内影响效率;过于激进,又可能触发危险的碰撞事件。

在过往研究中,传统规划器(如MPC)虽具可解释性,但在动态交通中响应慢、鲁棒性差;而神经网络规划器虽然能高效学习复杂场景,却普遍缺乏可验证的安全保证

为解决这一核心矛盾,美国西北大学与小马智行(Pony.ai)团队联合提出了

Safety-driven Interactive Planning Framework(SafIn NN)
安全驱动的交互式神经网络规划框架
通过融合学习与形式化安全验证,使神经网络规划首次实现“可解释且可验证”的安全控制。


二、总体架构:学习与安全的协同闭环

SafIn NN 框架将整个车道变换过程拆解为三个互补的功能模块(图1):

  1. 神经网络纵向与横向规划器(NN Planners)
    输出自车在纵向加速度 axa_xax 与横向加速度 aya_yay 上的最优控制;

  2. 后车行为预测与攻击性评估(Aggressiveness Assessment)
    判断目标车道后车是“礼让”还是“封堵”,以评估交互风险;

  3. 安全驱动决策与行为调整模块(Safety-driven Adjustment)
    根据形式化安全判据动态选择三种策略:继续变道犹豫等待中止回退

这一结构的关键在于:
每个周期(0.1 秒)都会执行一次“学习输出 + 安全验证 + 行为再决策”的循环闭环,
实现了学习型规划器的实时安全约束。


三、神经网络规划器:以学习替代代价函数

1. 输入与输出定义

系统状态向量包括:

S=[px,py,vx,vy,px,l,vx,l,px,f,vx,f]S = [p_x, p_y, v_x, v_y, p_{x,l}, v_{x,l}, p_{x,f}, v_{x,f}]S=[px,py,vx,vy,px,l,vx,l,px,f,vx,f]

其中下标 l,fl, fl,f 分别表示目标车道前车与后车。

纵向与横向两个神经网络各自独立训练,输出控制量:

A=[ax,ay]A = [a_x, a_y]A=[ax,ay]

2. 数据与训练

为确保神经网络规划接近最优解,研究者首先利用模型预测控制(MPC)在多场景下生成3600万条样本轨迹,并以此作为监督信号训练网络。
MPC 的目标函数在油耗与时间之间权衡:

J=α∫ax2 dt+β(tf−t0)J = alpha int a_x^2 , dt + beta (t_f - t_0)J=αax2dt+β(tft0)

其中 α,βalpha,betaα,β 为调节系数。训练使用 Adam 优化器,MSE 作为损失函数。
网络步长 δt=0.1 sdelta t = 0.1,mathrm{s}δt=0.1s,输入归一化处理。


四、攻击性预测模块:学习人类驾驶行为

1. 行为模型与加速度判定

SafIn NN 引入一个神经网络评估目标车道后车的“攻击性”(Aggressiveness)。
假设后车 F 可能属于两种驾驶类型:

  • 谨慎(Cautious):会主动减速让行;

  • 激进(Aggressive):倾向加速阻止变道。

对应两个加速度预测模型 a1a_1a1a0a_0a0。系统实时计算 F 车真实加速度 ax,f∗a^*_{x,f}ax,f,并根据阈值 atha_{th}ath 判断类型:

{∣ax,f∗−a1∣<∣ax,f∗−a0∣−ath⇒Cautious∣ax,f∗−a0∣<∣ax,f∗−a1∣−ath⇒AggressiveOtherwise⇒Aggressive (Default)begin{cases} |a^*_{x,f} - a_1| < |a^*_{x,f} - a_0| - a_{th} &Rightarrow text{Cautious} |a^*_{x,f} - a_0| < |a^*_{x,f} - a_1| - a_{th} &Rightarrow text{Aggressive} text{Otherwise} &Rightarrow text{Aggressive (Default)} end{cases}ax,fa1<ax,fa0athax,fa0<ax,fa1athOtherwiseCautiousAggressiveAggressive (Default)

实验默认 ath=0.5a_{th}=0.5ath=0.5。阈值越高,预测越保守、不确定性越大。

2. 数据生成与训练配置

基于改进版IDM(Intelligent Driver Model)生成约 100万条样本,参数采样范围:

  • 加速度极限 ax,a=4 m/s2a_{x,a}=4,mathrm{m/s^2}ax,a=4m/s2,制动极限 ax,d=6 m/s2a_{x,d}=6,mathrm{m/s^2}ax,d=6m/s2

  • 期望时距 tg∈[1,2]t_gin[1,2]tg[1,2],安全距离 hs∈[5,8]h_sin[5,8]hs[5,8]

实验表明,当 ath=0.5a_{th}=0.5ath=0.5 时,预测误判率为 15.9%,但不确定率高达 56.3%
由于系统每 0.1 s 重新评估一次,即使出现短期误判,也能在数帧内自动纠正。


五、形式安全分析:以可证明方式约束学习结果

SafIn NN 的安全核心在于——

每次执行决策前,必须验证是否存在“安全逃逸轨迹”

只要在最坏假设下仍可避免碰撞,才允许执行该动作。
这一思想对应三个核心判据:

1. 横向逃逸轨迹(Safe Lateral Evasion)

设当前车道中心 y=0y=0y=0,目标车道中心 y=wly=w_ly=wl,车宽 wvw_vwv
车辆可通过双段加速度控制实现“最速回原”:

{py(t)=py0+vy0t1−12ay,mt12+(vy0−ay,mt1)(ty,f−t1)+12ay,m(ty,f−t1)2vy(ty,f)=0begin{cases} p_y(t) = p_{y0} + v_{y0} t_1 - frac{1}{2}a_{y,m}t_1^2 + (v_{y0}-a_{y,m}t_1)(t_{y,f}-t_1) + frac{1}{2}a_{y,m}(t_{y,f}-t_1)^2 v_y(t_{y,f}) = 0 end{cases}{py(t)=py0+vy0t121ay,mt12+(vy0ay,mt1)(ty,ft1)+21ay,m(ty,ft1)2vy(ty,f)=0

解得 t1,ty,ft_1, t_{y,f}t1,ty,f,若回原车道中心前可避开前后车包络区,则通过验证。

2. 纵向安全距离判定

面对前车急刹:

若前车以 ax,l,da_{x,l,d}ax,l,d 紧急制动,则需满足:

C1=px,0−px,l+vx,0ty,f−12ax,dty,f2−vx,l22ax,l,d+pm<0C_1 = p_{x,0}-p_{x,l}+v_{x,0}t_{y,f}-frac{1}{2}a_{x,d}t_{y,f}^2 - frac{v_{x,l}^2}{2a_{x,l,d}} + p_m < 0C1=px,0px,l+vx,0ty,f21ax,dty,f22ax,l,dvx,l2+pm<0

C2=px,0−px,l+vx,022ax,d−vx,l22ax,l,d+pm<0C_2 = p_{x,0}-p_{x,l}+frac{v_{x,0}^2}{2a_{x,d}} - frac{v_{x,l}^2}{2a_{x,l,d}} + p_m < 0C2=px,0px,l+2ax,dvx,022ax,l,dvx,l2+pm<0

其中 pmp_mpm 为最小纵向安全间距。

面对后车加速封堵:

若后车以 ax,f,aa_{x,f,a}ax,f,a 加速,则需保证:

px,0+vx,0t2+12ax,at22+(vx,0+ax,at2)22ax,d>px,f+vx,fty,f+12ax,f,aty,f2+pmp_{x,0}+v_{x,0}t_2+frac{1}{2}a_{x,a}t_2^2+frac{(v_{x,0}+a_{x,a}t_2)^2}{2a_{x,d}} > p_{x,f}+v_{x,f}t_{y,f}+frac{1}{2}a_{x,f,a}t_{y,f}^2 + p_mpx,0+vx,0t2+21ax,at22+2ax,d(vx,0+ax,at2)2>px,f+vx,fty,f+21ax,f,aty,f2+pm

成立时表示存在可逃逸空间。

3. 犹豫与中止策略

若判定无安全轨迹,则系统减速并调整横向加速度:

ay=min⁡(max⁡(−vy/δt,−ay,m),ay,m)a_y = min(max(-v_y/delta t, -a_{y,m}), a_{y,m})ay=min(max(vy/δt,ay,m),ay,m)

使横向速度逐步归零,实现稳定等待。


六、实验设置与结果:从仿真到实车

1. 仿真场景

每轮仿真 10 s,时间步长 0.1 s。
随机生成 200,000 组初始条件,覆盖前后车速度、加速度、间距等参数。

场景难度分为四级:

  1. 宽松:ax,l∈[−6,4]a_{x,l}in[-6,4]ax,l[6,4]Δp∈[7,37]Delta pin[7,37]Δp[7,37]

  2. 中等:ax,l∈[−6,0]a_{x,l}in[-6,0]ax,l[6,0]Δp∈[7,37]Delta pin[7,37]Δp[7,37]

  3. 拥堵:ax,l∈[−6,4]a_{x,l}in[-6,4]ax,l[6,4]Δp∈[7,17]Delta pin[7,17]Δp[7,17]

  4. 极端:ax,l∈[−6,0]a_{x,l}in[-6,0]ax,l[6,0]Δp∈[7,17]Delta pin[7,17]Δp[7,17]

2. 方法比较

场景层级方法变道时长(s)终止横向(m)成功率碰撞率
MPC1.903.4492.6%7.4%

Only NN1.703.2589.6%10.4%

SafIn NN1.902.7380.3%0%
MPC1.903.4687.5%12.5%

Only NN1.683.3082.4%17.6%

SafIn NN2.082.4467.9%0%
难①MPC1.903.4483.1%16.9%

Only NN1.733.2484.5%15.5%

SafIn NN1.972.2361.5%0%
难②MPC1.903.4671.8%28.2%

Only NN1.713.2974.3%25.7%

SafIn NN2.341.6638.8%0%

SafIn NN 在所有场景中实现 碰撞率 0%
成功率下降的部分来自系统主动放弃高风险变道,而非规划失败。

3. 实车数据验证

使用 Pony.ai 实采集的 48 个高密度交通场景
结果:

  • SafIn NN:0 碰撞;

  • Only NN:12 起碰撞;

  • MPC:7 起轻度接触;
    SafIn NN 多次展现出“人类式犹豫”:在检测到后车加速封堵后主动放弃变道,3~4 秒后重新尝试成功。


七、分析与讨论:安全、效率与人类行为的平衡

SafIn NN 的实验结果揭示了一个重要事实:

“主动保守”是安全的前提。

在实际交通中,后车的不确定性极高。即便机器学习模型能高精度预测平均行为,也难以保证极端情况下的安全。
SafIn NN 通过形式化安全验证 + 动态行为评估的协同方式,让AI规划具备了“安全自省”能力。

其核心价值在于:

  • 深度学习输出嵌入形式安全框架

  • 交互性交通中实现了可验证决策;

  • 使神经网络规划从“黑箱决策”走向“透明安全”


八、结论与展望

SafIn NN 提出了一种安全与智能兼容的新范式:

  • 神经网络学习复杂驾驶策略

  • 形式化安全约束确保系统不越线

  • 通过实时交互评估实现人类级驾驶判断。

未来方向包括:

  1. 引入多智能体博弈学习模型,进一步提升交互预测的鲁棒性;

  2. 将安全层嵌入强化学习或端到端驾驶框架;

  3. 在城市道路、环岛汇入等复杂场景中扩展验证。

SafIn NN 不只是一个规划算法,更像一个学习系统的“安全监督者”——
它让神经网络在领域真正具备“可解释、安全、工程可行”的特征。


【编辑点评】

SafIn NN 框架代表了智能驾驶规划从“黑箱AI”到“形式安全AI”的关键转折。
它在学术上首次实现了神经网络规划与安全验证的统一闭环,在工程上为车规级AI提供了可验证的安全防线。
在未来的L4及更高级别自动驾驶系统中,类似的安全驱动架构将成为标准组件,推动AI驾驶迈向可控与可信。


关键词: 自动驾驶

评论


相关推荐

技术专区

关闭