%0 Journal Article
%A 姚恩建
%A 陈卓利
%A 郝赫
%A 陈荣升
%A 杨扬
%T 基于强化学习的自动驾驶车辆路上突发障碍物换道避障控制算法
%D 2025
%R 10.11860/j.issn.1673-0291.20250149
%J &#x661F;&#x7A7A;&#x7535;&#x7ADE;&#x61;&#x70;&#x70;&#x32;&#x30;&#x32;&#x36;&#x6700;&#x65B0;&#x7248;学报
%P 82-93
%V 49
%N 5
%X <p>针对路上突发障碍物下自动驾驶车辆换道避障问题，提出基于深度强化学习（Deep Reinforcement Learning，DRL）的车辆控制算法SafeLC-DelayDDPG.首先，将该问题建模为马尔可夫决策过程（Markov Decision Process，MDP），构建了结构化混合状态空间，融合局部观测、车道语义信息和自车全局状态，提高环境感知与风险敏感性.动作空间采用连续的前轮转向角与纵向加速度.奖励函数以二维碰撞时间（Two-dimensional time-to-collision，2D-TTC）指标为核心，兼顾安全、效率、舒适和规则，并采用条件化动态权重机制，引导策略在高风险时优先安全、在低风险时提升效率.然后，引入延迟策略更新与目标策略平滑机制，改进Critic网络损失函数，缓解深度确定性策略梯度（Deep Deterministic Policy Gradient，DDPG）算法训练不稳定及Q值过估计问题.最后，通过不同场景下的交通仿真验证了所提方法的有效性.仿真结果表明：与多个基线算法相比，该算法安全性与效率更优，训练期首次和连续避障成功率分别最多提升约17.9%和60.5%，安全性指标值最多提升约7.6%，平均速度最多提升约2.1%；在不同场景测试中，首次和连续避障成功率分别最多提升约25.9%和44.1%，安全性指标值最多提升约9.8%，平均速度最多提升约0.6%.</p>
%U https://jdxb.bjtu.edu.cn/CN/10.11860/j.issn.1673-0291.20250149