在安全线性赌臂中利用问题几何

摘要:安全线性赌博问题是经典线性赌博问题的一个版本,学习者的行动在所有回合中必须满足一个不确定的线性约束。由于在许多实际场景中的适用性,这个问题在近年来得到了广泛关注。我们发现通过利用具体问题设置的几何特性,可以为分离较好的问题实例和有限星凸集的行动集提供改进的遗憾保证。此外,我们提出了一种新颖的算法,用于自适应选择问题参数,并享有与现有算法至少一样好的遗憾保证。最后,我们引入了安全线性赌博设置的一个推广,其中约束是凸的,并通过利用一种新颖的基于凸分析的方法来调整我们的算法和分析。仿真结果显示出在各种随机抽样的设置下相比现有算法的性能提升。

作者:Spencer Hutchinson, Berkay Turan, Mahnoosh Alizadeh

论文ID:2308.15006

分类:Machine Learning

分类简称:cs.LG

提交时间:2023-08-30

PDF 下载: 英文版 中文版pdf翻译中