迭代学习控制——失控-arXiv论文预印本中文版

迭代学习控制——失控

摘要：迭代学习控制（ILC）是在AI和神经网络出现之前的一种激动人心的概念，旨在训练机器人执行重复任务或训练系统拒绝准周期干扰。然而，在满足ILC渐近收敛（AC）稳定性标准的系统中，出现了被称为“学习瞬变”的现象，这使得人们的兴奋逐渐消退。这些瞬变可能持续很长时间，即使特征值表明它们应该已经衰减，并且跨越了数量级。它们同时出现在因果和非因果学习中。通过引入“向量范数单调收敛”测试，该领域得以恢复；但是并没有提供深入和真正令人满意的解释。在本文中，我们探讨了将迭代指标与试验内样本指标耦合的ILC方程的解。这为因果学习提供了一些线索-其中AC测试给出了重复特征值。此外，自2016年以来，本文作者已经证明了一种新类解，这些解类似于孤子，满足ILC的递归方程，并对长期行为提供了额外的见解。孤子是一种类似于波状的物体，它出现在分散介质中，以可识别的速度几乎不改变形状。本文是孤子解的首次公开演示，这种解可能发生在具有矩阵表示的对角带结构的因果（即向后看）和非因果（即向前看）学习函数中。

作者：Shane Rupert Koscielniak

论文ID：2210.05351

分类：Accelerator Physics

分类简称：physics.acc-ph

提交时间：2022-10-14

PDF 下载： 英文版中文版pdf翻译中