赞助搜索的预算优化：在MDPs中的审查学习-arXiv论文预印本中文版

赞助搜索的预算优化：在MDPs中的审查学习

摘要：通过参与反复赞助搜索竞拍，广告商面临预算优化问题，旨在在预算内最大化点击次数。我们将预算优化问题建模为具有被审查观测的马尔可夫决策过程（MDP），并提出一种基于著名的Kaplan-Meier或产物限定估计器的学习算法。通过将其与其他几种算法在大量来自微软adCenter的搜索竞拍数据上进行比较，验证了该算法的性能，并展示了其快速收敛到最佳性能的能力。

作者：Kareem Amin, Michael Kearns, Peter Key, Anton Schwaighofer

论文ID：1210.4847

分类：Computer Science and Game Theory

分类简称：cs.GT

提交时间：2012-10-19

PDF 下载： 英文版中文版pdf翻译中