在观测值远多于变量的数据中找到外生变量
摘要:高维因果建模中鉴定外因变量的方法:基于非高斯性的方法 有效地建模高维因果关系对于基因表达数据等现代数据集来说是具有挑战性的,这些数据集中变量的数量远远大于观测样本的数量。本文提出了一种方法,用于在线性非高斯因果模型中鉴定外因变量。该方法在样本量远小于传统方法所需的情况下,即便在高维场景下(变量数量远远大于观测样本的数量),也能正常工作。其关键思想是基于非高斯性来确定哪些变量是外因变量,而不是对整个模型结构进行估计。外因变量在模型中触发因果链的启动,其鉴别可以帮助设计更高效的实验和更深入理解因果机制。我们通过人工数据和真实世界的基因表达数据进行实验证明了该方法的有效性。
作者:Shohei Shimizu, Takashi Washio, Aapo Hyvarinen, Seiya Imoto
论文ID:0904.0838
分类:Machine Learning
分类简称:stat.ML
提交时间:2011-04-08