使用基于MDL的局部和全局回归方法揭示因果关系
摘要:基于信息论的原则,通过Kolmogorov复杂性及使用最小描述长度(MDL)原理,我们提出了一种实用的方法来解决从观测数据中推断两个单变量数值随机变量$X$和$Y$之间因果方向的基本问题。特别是在两变量情况下,由于无法使用标准的条件独立性测试,解决这个问题尤其困难。为了解决这个问题,我们提出了一种压缩方案,使用基于MDL的回归编码局部和全局的函数关系。我们认为,如果将$Y$描述为$X$的函数所需的描述长度比将$X$描述为$Y$的函数所需的描述长度短,那么我们可以推断出$X$是$Y$的原因。此外,我们还引入了一种效率高且时间复杂度为线性的新算法Slope,通过对合成数据和实际数据进行详尽的实证评估,我们表明其性能远远超过现有技术水平。
作者:Alexander Marx and Jilles Vreeken
论文ID:1709.08915
分类:Machine Learning
分类简称:stat.ML
提交时间:2018-08-23