预测性深度学习方法在输出调节中的应用:协作追逃案例

摘要:在这篇论文中,我们考虑了在未知且可能具有敌对性的环境中控制一种欠驱动系统的问题。重点将放在基于Dubins动力学模型的自主飞行器上。所提出的控制方法是基于在线预测的变量积分器,用于目标追踪。为了展示我们方法的效果,我们分析了多个自主代理之间的追逐逃逸游戏。为了消除对逃避者未来策略的完美知识的需求,我们使用一个深度神经网络,该网络通过在线收集到的测量数据训练来近似逃避者的行为。

作者:Shashwat Shivam, Aris Kanellopoulos, Kyriakos G. Vamvoudakis, Yorai Wardi

论文ID:1909.00893

分类:Multiagent Systems

分类简称:cs.MA

提交时间:2019-09-04

PDF 下载: 英文版 中文版pdf翻译中