稀疏线性可识别多变量建模
摘要:稀疏且可识别的线性潜变量(因子)和贝叶斯网络模型用于对多元数据进行简洁分析。我们提出了一个计算有效的方法,用于联合参数和模型推断以及模型比较。它包括使用钢板和尖峰先验(两个分量的 δ-函数和连续混合)、非高斯潜在因子和对变量排序的随机搜索的稀疏模型的完全贝叶斯层次结构。我们称这个框架为 SLIM (稀疏线性可识别多变量建模),并在人工和真实生物数据集上进行验证和基准测试。SLIM 在精神上最接近于 LiNGAM(Shimizu等人,2006),但在推断、贝叶斯网络结构学习和模型比较方面有很大不同。实验上,SLIM 的性能与 LiNGAM 相当或更好,并具有可比较的计算复杂度。我们将这主要归因于所使用的随机搜索策略和适度性(稀疏性和可识别性),这是模型的一个明确部分。我们对基本的独立同分布的线性模型框架提出了两个扩展:对观测变量的非线性依赖,称为 SNIM(稀疏非线性可识别多变量建模),以及对潜变量之间的相关性的允许,称为 CSLIM(相关 SLIM),适用于时间和/或空间数据。源代码和脚本可从 http://cogsys.imm.dtu.dk/slim/ 下载。
作者:Ricardo Henao and Ole Winther
论文ID:1004.5265
分类:Machine Learning
分类简称:stat.ML
提交时间:2011-06-24