确保机器教学的屏障证书

摘要:机器教学可以被视为学习的最优控制。给定一个学习者的模型,机器教学旨在确定将学习者引导向目标假设的最优训练数据。本文关注使用控制理论对机器教学算法提供保证。具体而言,我们研究了机器教学文献中一个被广泛应用的学习者模型,该模型基于对版本空间的局部偏好。我们将基于偏好的学习者教学问题解释为解决一个部分可观察马尔可夫决策过程(POMDP)。然后,我们展示了POMDP问题可以被看作是一个特殊的混合系统,即离散时间切换系统。随后,我们使用屏障证明来验证这个特殊混合系统的集合性质。我们展示了如何将屏障证明的计算分解并数值实现为一个求解和-of-squares(SOS)程序的解。为了说明,我们展示了基于控制理论的提议框架如何用于验证两种知名的机器教学方法的教学效果。

作者:Mohamadreza Ahmadi, Bo Wu, Yuxin Chen, Yisong Yue, and Ufuk Topcu

论文ID:1810.00093

分类:Systems and Control

分类简称:cs.SY

提交时间:2019-08-06

PDF 下载: 英文版 中文版pdf翻译中