掌握北环赛道——一种用于机器人运动竞技中AI策略决策的全面赛车模拟

摘要:GT赛车中的比赛策略对决定比赛结果起着至关重要的作用。这种策略主要关注停车的时机,由于燃油消耗和轮胎性能下降,停车是必要的。比赛策略的目标是在停车时间损失的基础上平衡停车的优势,比如更换轮胎和加油。目前的比赛模拟用于估计最佳比赛策略,有粒度、概率事件建模和需手动输入入站信息等方面的差异。本文通过开发一种针对GT赛车的新型模拟模型,并利用人工智能来自动化战略决策,解决了这些限制。通过将模拟与OpenAI的Gym框架结合,创建了一个强化学习环境并训练了一个智能体。本研究评估了不同的超参数配置、观测空间和奖励函数,并利用2020年纽伯格林长距离系列赛的历史时间数据进行实证参数验证。结果表明,强化学习在提高比赛策略决策方面具有潜力,训练后的智能体对于停车时间和加油量做出明智的决策。学习率、衰减率和剧集数量等关键参数被确定为关键因素,而燃油质量和当前比赛位置的组合被证明对政策制定最有效。本研究为在赛车模拟中更广泛应用强化学习以及在GT赛车领域实现比赛策略优化提供了贡献。

作者:Max Boettinger, David Klotz

论文ID:2306.16088

分类:Artificial Intelligence

分类简称:cs.AI

提交时间:2023-06-29

PDF 下载: 英文版 中文版pdf翻译中