在线贝叶斯说服的最优速率和高效算法

摘要:贝叶斯说服研究了一个知情的发送者如何影响通过贝叶斯更新共享先验来做决策的理性接收者的信念。我们专注于在线贝叶斯说服框架,其中发送方重复面对一个或多个未知和敌对选择的接收方。首先,我们展示了如何在发送方面对单个接收方且具有部分反馈的情况下获得紧密的O(T^{1/2})后悔界,改进了先前已知的最佳界为O(T^{4/5})。然后,我们首次提供了在部分反馈条件下对多个接收方设置的无后悔保证。最后,我们展示了如何通过利用类型报告来设计多项式每次迭代运行时间的无后悔算法,从而规避在线贝叶斯说服上已知的难解性结果。当允许类型报告时,我们提供了高效的算法,保证在单接收方和多接收方场景下都具有O(T^{1/2})的后悔上界。

作者:Martino Bernasconi, Matteo Castiglioni, Andrea Celli, Alberto Marchesi, Nicola Gatti, Francesco Trov`o

论文ID:2303.01296

分类:Computer Science and Game Theory

分类简称:cs.GT

提交时间:2023-03-03

PDF 下载: 英文版 中文版pdf翻译中