强化学习视觉泛化的基准测试:RL-ViGen
摘要:视觉强化学习(Visual RL)结合高维观测一直面临着站在分布之外进行泛化的挑战。尽管有关解决视觉泛化问题的算法备受关注,我们认为问题在于现有的基准测试,因为它们仅限于孤立任务和泛化类别,削弱了对代理的视觉泛化能力进行全面评估的能力。为了弥合这一差距,我们引入了RL-ViGen:一种新颖的用于视觉泛化的强化学习基准测试,其中包含多样的任务和广泛的泛化类型,从而便于得出更可靠的结论。此外,RL-ViGen将最新的泛化视觉强化学习算法融入统一框架,实验结果表明,目前没有一种现有的算法在所有任务中普遍优势。我们的期望是RL-ViGen将成为该领域的推动因素,并为未来创建适用于真实场景的通用视觉泛化强化学习代理奠定基础。我们的代码和实施算法可以在https://gemcollector.github.io/RL-ViGen/上获得。
作者:Zhecheng Yuan, Sizhe Yang, Pu Hua, Can Chang, Kaizhe Hu, Xiaolong Wang, Huazhe Xu
论文ID:2307.10224
分类:Artificial Intelligence
分类简称:cs.AI
提交时间:2023-08-10