多臂赌博机机制在多插槽赞助搜索拍卖中的应用
摘要:在当前被搜索引擎广泛使用的按点击付费的拍卖中,一个关键字的拍卖涉及一定数量的广告商(假设为k),竞争可用的广告位(假设为m)来展示他们的广告。这个拍卖通常会进行多个回合(假设为T)。每个代理-广告位对(agent-slot pairs)都有与之相关的点击概率mu_ij。搜索引擎的目标是最大化广告商的社会福利,即广告商价值的总和。搜索引擎不知道广告商对点击其广告的真实价值,也不知道点击概率mu_ij。因此,对于搜索引擎来说,一个关键问题是在T轮拍卖中学习这些点击概率,并确保拍卖机制是真实的。最近引入的解决这种学习和激励问题的机制被称为多臂赌博机(MAB)机制。当m=1时,有关真实MAB机制的表征已经在文献中提供,并且已经证明这种机制的遗憾(regret)将是O(T^{2/3})。在本文中,我们旨在在现实但非平凡的一般情况下(m>1)推导出一个特征,并得出几个有趣的结果。
作者:Akash Das Sarma, Sujit Gujar, Y. Narahari
论文ID:1001.1414
分类:Computer Science and Game Theory
分类简称:cs.GT
提交时间:2010-01-17