上界置信度算法的简单修改:广义加权平均。

摘要:广义上确界(UCB)算法在多臂老虎机(MAB)问题中的应用:GWA-UCB1

作者:Nobuhito Manome, Shuji Shinohara, Ung-il Chung

论文ID:2308.14350

分类:Machine Learning

分类简称:cs.LG

提交时间:2023-08-29

PDF 下载: 英文版 中文版pdf翻译中