考虑概率的高级模型预测控制下的车道变更：通过课程强化学习-arXiv论文预印本中文版

考虑概率的高级模型预测控制下的车道变更：通过课程强化学习

摘要：稠密交通中的变道被认为是一个具有挑战性的问题，通常需要识别一个适当且合适的机会进行操作。在这项工作中，我们提出了一个具有高级模型预测控制（MPC）的机会感知变道策略，通过课程强化学习（CRL）来实现。我们框架中的MPC以增强决策变量为参数化，引入了全态参考和涉及相对重要性的调节因素。此外，为了提高收敛速度并确保高质量的策略，有效的课程设计与策略转移和增强被整合到强化学习（RL）框架中。然后，将所提出的框架部署到面向稠密且动态交通的数值模拟中。值得注意的是，在给定狭窄的机会下，所提出的方法生成了高质量的变道操作，使车辆以96％的高成功率合并到交通流中。

作者：Yubin Wang, Yulin Li, Zengqi Peng, Hakim Ghazzai, Jun Ma

论文ID：2303.03723

分类：Robotics

分类简称：cs.RO

提交时间：2023-08-31

PDF 下载： 英文版中文版pdf翻译中