推理虚拟智能行为及其参数

摘要:一种能够对其他不认识的智能体进行有效交互的方法是通过保持对这些智能体可能具有的一组假设行为或类型的信念。这种方法的一个当前限制是它不识别类型规范中的参数,因为类型被视为从相互作用历史到动作的概率分布的黑盒映射。在这项工作中,我们提出了一种通用的方法,允许智能体同时考虑类型的相对可能性和类型中的任何有界连续参数的值。该方法为每个类型维护单独的参数估计,并在每次观察后有选择地更新某些类型的估计。我们提出了不同的类型选择和参数估计方法。所提出的方法在详细的实验中进行了评估,结果显示在每次观察后更新单个类型的参数估计就足以实现良好的性能。

作者:Stefano V. Albrecht, Peter Stone

论文ID:1906.11064

分类:Multiagent Systems

分类简称:cs.MA

提交时间:2019-06-27

PDF 下载: 英文版 中文版pdf翻译中