森林密度估计

摘要:高维图估计和密度估计的研究,使用基于森林结构的无向图模型的一系列密度估计器。对于密度估计,我们不假设真实分布对应于森林; 相反,我们对双变量和单变量的边缘进行核密度估计,并应用Kruskal的算法来估计保留数据上的最优森林。我们证明了相对于最佳森林的风险的估计结果相对于超额风险的预言不等式。对于图估计,我们考虑了估计有限树大小的森林的问题。我们证明了带有限制树大小的最大权重生成森林问题是NP难的,并为该问题开发了近似算法。将树大小视为复杂度参数,然后我们使用数据分割选择了一个森林,并证明了过程的超额风险和结构选择一致性边界。通过使用模拟数据和微阵列数据进行的实验表明,这些方法是高斯图模型的实际可替代方法。

作者:Han Liu, Min Xu, Haijie Gu, Anupam Gupta, John Lafferty, Larry Wasserman

论文ID:1001.1557

分类:Machine Learning

分类简称:stat.ML

提交时间:2010-10-21

PDF 下载: 英文版 中文版pdf翻译中