迭代学习控制——失控

摘要:迭代学习控制(ILC)是在AI和神经网络出现之前的一种激动人心的概念,旨在训练机器人执行重复任务或训练系统拒绝准周期干扰。然而,在满足ILC渐近收敛(AC)稳定性标准的系统中,出现了被称为“学习瞬变”的现象,这使得人们的兴奋逐渐消退。这些瞬变可能持续很长时间,即使特征值表明它们应该已经衰减,并且跨越了数量级。它们同时出现在因果和非因果学习中。通过引入“向量范数单调收敛”测试,该领域得以恢复;但是并没有提供深入和真正令人满意的解释。在本文中,我们探讨了将迭代指标与试验内样本指标耦合的ILC方程的解。这为因果学习提供了一些线索-其中AC测试给出了重复特征值。此外,自2016年以来,本文作者已经证明了一种新类解,这些解类似于孤子,满足ILC的递归方程,并对长期行为提供了额外的见解。孤子是一种类似于波状的物体,它出现在分散介质中,以可识别的速度几乎不改变形状。本文是孤子解的首次公开演示,这种解可能发生在具有矩阵表示的对角带结构的因果(即向后看)和非因果(即向前看)学习函数中。

作者:Shane Rupert Koscielniak

论文ID:2210.05351

分类:Accelerator Physics

分类简称:physics.acc-ph

提交时间:2022-10-14

PDF 下载: 英文版 中文版pdf翻译中