高效在线决策:组合多臂赌博机方法
摘要:在线决策在许多实际应用中起着关键作用。在许多情况下,决策是基于对输入数据点执行一系列测试来进行的。然而,执行所有测试可能是昂贵的,也不总是可能的。在本文中,我们基于组合多臂赌博机提供了在线决策问题的新形式,并考虑了执行测试的成本。基于这个形式,我们提供了一种新的成本效益的在线决策框架,可以利用后验抽样或BayesUCB进行探索。我们为我们的框架提供了严格的理论分析,并呈现了各种实验结果,证明了它在解决实际问题方面的适用性。
作者:Arman Rahbar, Niklas {AA}kerblom, Morteza Haghir Chehreghani
论文ID:2308.10699
分类:Machine Learning
分类简称:cs.LG
提交时间:2023-08-22