高维图模型的稳定性正则化选择方法(StARS)

摘要:稀疏化正则化参数的选择是估计高维图模型中的一个具有挑战性的问题。标准技术包括K折交叉验证(K-CV),Akaike信息准则(AIC)和贝叶斯信息准则(BIC)。虽然这些方法适用于低维问题,但在高维设置下不适用。在本文中,我们提出了StARS:一种新的基于稳定性的方法,用于选择高维无向图推断中的正则化参数。该方法具有明确的解释:我们使用最小的正则化程度,同时使得图在随机抽样下同时稀疏和可复制。这种解释基本上不需要任何条件。在温和的条件下,我们证明了在图估计方面StARS是部分稀疏一致的:即在大多数情况下,当图的大小随样本量发散时,所有真实边将包含在选择的模型中。在实证方面,我们将StARS的性能与包括K-CV、AIC和BIC在内的最先进的模型选择程序在合成数据和真实的微阵列数据集上进行了比较。StARS的表现优于所有这些竞争程序。

作者:Han Liu, Kathryn Roeder, Larry Wasserman

论文ID:1006.3316

分类:Machine Learning

分类简称:stat.ML

提交时间:2010-06-18

PDF 下载: 英文版 中文版pdf翻译中