马尔可夫决策过程中概率提升因果关系的基础
摘要:引入了一种使用概率升高原则在马尔科夫决策过程中的新因果关系。首先考虑状态集作为因果关系的原因和效果,然后将其扩展到正常路径属性作为效果,再作为原因。本文奠定了数学基础,分析了这些因果关系的算法特性。这包括了在给定效果的情况下检查原因条件的算法和决定概率升高原因的存在性。由于定义允许亚最优覆盖属性,因此研究了受统计分析概念启发的因果关系质量度量。这包括召回率、覆盖率和F值。分析了根据这些度量找到最优原因的计算复杂性。
作者:Christel Baier, Jakob Piribauer, and Robin Ziemek
论文ID:2209.02973
分类:Logic in Computer Science
分类简称:cs.LO
提交时间:2023-07-11