掌握北环赛道——一种用于机器人运动竞技中AI策略决策的全面赛车模拟-arXiv论文预印本中文版

掌握北环赛道——一种用于机器人运动竞技中AI策略决策的全面赛车模拟

摘要：GT赛车中的比赛策略对决定比赛结果起着至关重要的作用。这种策略主要关注停车的时机，由于燃油消耗和轮胎性能下降，停车是必要的。比赛策略的目标是在停车时间损失的基础上平衡停车的优势，比如更换轮胎和加油。目前的比赛模拟用于估计最佳比赛策略，有粒度、概率事件建模和需手动输入入站信息等方面的差异。本文通过开发一种针对GT赛车的新型模拟模型，并利用人工智能来自动化战略决策，解决了这些限制。通过将模拟与OpenAI的Gym框架结合，创建了一个强化学习环境并训练了一个智能体。本研究评估了不同的超参数配置、观测空间和奖励函数，并利用2020年纽伯格林长距离系列赛的历史时间数据进行实证参数验证。结果表明，强化学习在提高比赛策略决策方面具有潜力，训练后的智能体对于停车时间和加油量做出明智的决策。学习率、衰减率和剧集数量等关键参数被确定为关键因素，而燃油质量和当前比赛位置的组合被证明对政策制定最有效。本研究为在赛车模拟中更广泛应用强化学习以及在GT赛车领域实现比赛策略优化提供了贡献。

作者：Max Boettinger, David Klotz

论文ID：2306.16088

分类：Artificial Intelligence

分类简称：cs.AI

提交时间：2023-06-29

PDF 下载： 英文版中文版pdf翻译中