赞助搜索的预算优化:在MDPs中的审查学习
摘要:通过参与反复赞助搜索竞拍,广告商面临预算优化问题,旨在在预算内最大化点击次数。我们将预算优化问题建模为具有被审查观测的马尔可夫决策过程(MDP),并提出一种基于著名的Kaplan-Meier或产物限定估计器的学习算法。通过将其与其他几种算法在大量来自微软adCenter的搜索竞拍数据上进行比较,验证了该算法的性能,并展示了其快速收敛到最佳性能的能力。
作者:Kareem Amin, Michael Kearns, Peter Key, Anton Schwaighofer
论文ID:1210.4847
分类:Computer Science and Game Theory
分类简称:cs.GT
提交时间:2012-10-19