深度可学习的多问题双边谈判策略模板
摘要:使用策略模板来学习多议题双边谈判的策略:一个策略模板由一组可解释的参数化策略组成,用于在任何时候决策最优行动。我们使用深度强化学习和演员-评论家架构来估计策略参数的值,包括接受报价的阈值效用以及生成新出价的方法。与现有研究只估计这些策略的阈值效用相比,我们的方法能够对整个策略进行估计。我们通过从使用"教师策略"收集的数据集进行监督预训练策略,从而减少了在谈判学习期间所需的探索时间。因此,我们构建了能够适应不同谈判领域而无需预编程的多议题谈判自动化代理。我们通过实验结果表明,我们的方法在个体和社会效率方面优于现有技术水平。
作者:Pallavi Bagga, Nicola Paoletti, Kostas Stathis
论文ID:2201.02455
分类:Multiagent Systems
分类简称:cs.MA
提交时间:2022-01-10