机动目标的角度导引增强学习

摘要:一种仅使用导引器视线角度测量和其变化速率的观测值的新型导引法在本文中被提出。该策略通过强化元学习进行优化,并在模拟的中程外大气拦截的末段演示了其效果。值得注意的是,该导引法不需要范围估计,因此特别适用于被动型导引器。优化的策略将稳定的导引器视线角度和其变化速率直接映射到导弹转向喷射器的推力指令上。利用强化元学习使优化的策略能够适应目标加速度,并且我们证明该策略在与完美目标加速度知识的增强零努力导引法相当的性能。优化的策略在计算效率上高效且需要最少的内存,并且应与当今的飞行处理器相容。

作者:Brian Gaudet, Roberto Furfaro, Richard Linares

论文ID:1906.02113

分类:Systems and Control

分类简称:cs.SY

提交时间:2020-09-16

PDF 下载: 英文版 中文版pdf翻译中