%0 Journal Article %A 姚恩建 %A 陈卓利 %A 郝赫 %A 陈荣升 %A 杨扬 %T 基于强化学习的自动驾驶车辆路上突发障碍物换道避障控制算法 %D 2025 %R 10.11860/j.issn.1673-0291.20250149 %J 星空电竞app2026最新版学报 %P 82-93 %V 49 %N 5 %X

针对路上突发障碍物下自动驾驶车辆换道避障问题,提出基于深度强化学习(Deep Reinforcement Learning,DRL)的车辆控制算法SafeLC-DelayDDPG.首先,将该问题建模为马尔可夫决策过程(Markov Decision Process,MDP),构建了结构化混合状态空间,融合局部观测、车道语义信息和自车全局状态,提高环境感知与风险敏感性.动作空间采用连续的前轮转向角与纵向加速度.奖励函数以二维碰撞时间(Two-dimensional time-to-collision,2D-TTC)指标为核心,兼顾安全、效率、舒适和规则,并采用条件化动态权重机制,引导策略在高风险时优先安全、在低风险时提升效率.然后,引入延迟策略更新与目标策略平滑机制,改进Critic网络损失函数,缓解深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法训练不稳定及Q值过估计问题.最后,通过不同场景下的交通仿真验证了所提方法的有效性.仿真结果表明:与多个基线算法相比,该算法安全性与效率更优,训练期首次和连续避障成功率分别最多提升约17.9%和60.5%,安全性指标值最多提升约7.6%,平均速度最多提升约2.1%;在不同场景测试中,首次和连续避障成功率分别最多提升约25.9%和44.1%,安全性指标值最多提升约9.8%,平均速度最多提升约0.6%.

%U https://jdxb.bjtu.edu.cn/CN/10.11860/j.issn.1673-0291.20250149