协同爬行的强化学习
摘要:直线爬行运动是一种原始且常见的柔软细长动物运动模式。它需要协调的收缩沿着与环境摩擦的身体传播。我们提出了一种简单的方法来理解这些协调在分段柔软爬行器的神经机械模型中是如何出现的,这种方法可能具有生物学前因和技术相关性。通过使用简单的强化学习算法,我们展示了初始的全连接神经元耦合经过收敛后变成简单的最近邻神经连线,使爬行器能够使用局部收缩波向前移动,这与D. melanogaster幼虫和许多仿生解决方案中所观察到的相似。所得结果是奖励中步态规则化权重的函数,存在速度和对本体感觉噪声的稳健性之间的权衡。总体而言,我们的结果将大脑-身体-环境三元组嵌入到一种学习方案中,对柔性机器人具有相关性,同时也对运动的进化和发育提供了一些启示。
作者:Shruti Mishra, Wim M. van Rees, L. Mahadevan
论文ID:2003.12845
分类:Biological Physics
分类简称:physics.bio-ph
提交时间:2021-08-31