考虑概率的高级模型预测控制下的车道变更:通过课程强化学习

摘要:稠密交通中的变道被认为是一个具有挑战性的问题,通常需要识别一个适当且合适的机会进行操作。在这项工作中,我们提出了一个具有高级模型预测控制(MPC)的机会感知变道策略,通过课程强化学习(CRL)来实现。我们框架中的MPC以增强决策变量为参数化,引入了全态参考和涉及相对重要性的调节因素。此外,为了提高收敛速度并确保高质量的策略,有效的课程设计与策略转移和增强被整合到强化学习(RL)框架中。然后,将所提出的框架部署到面向稠密且动态交通的数值模拟中。值得注意的是,在给定狭窄的机会下,所提出的方法生成了高质量的变道操作,使车辆以96%的高成功率合并到交通流中。

作者:Yubin Wang, Yulin Li, Zengqi Peng, Hakim Ghazzai, Jun Ma

论文ID:2303.03723

分类:Robotics

分类简称:cs.RO

提交时间:2023-08-31

PDF 下载: 英文版 中文版pdf翻译中