基于脑部扫描的逆向强化学习
摘要:通过逆向强化学习的方式,我们概述了一种代理程序学习通过脑功能磁共振成像(fMRI)来了解特定个体的决策方式的方法。在时间t,状态空间包括该个体的fMRI扫描,以表示其当时的脑状态。基本假设是个体的fMRI扫描所显示的信息取决于其思维和思维过程。该系统模拟了长期和短期记忆,以及我们可能不知晓的人脑内部动力学。人类专家将穿戴传感器的衣服一段时间,其信息将用于训练策略网络,同时将训练一个生成模型,以产生下一个fMRI扫描图像,条件为当前图像和环境状态。在操作过程中,人形机器人的动作将取决于这个不断演变的fMRI和其所处的环境。
作者:Tofara Moyo
论文ID:1906.09770
分类:Other Computer Science
分类简称:cs.OH
提交时间:2019-07-14