二分类回归树和随机森林中的变量重要性

摘要:二分类回归树中的变量重要性(VIMP)和变量成对关联进行了表征和研究。其中一个关键组成部分是我们所称之为最大子树的节点均方误差。该理论自然地从单个树扩展到树的集合,并适用于随机森林等方法。这对于随机森林中的重要性值非常有用,例如用于对生物信息学中的高通量基因组数据进行筛选,但关于它们的性质几乎没有理论存在。

作者:Hemant Ishwaran

论文ID:0711.2434

分类:Machine Learning

分类简称:stat.ML

提交时间:2009-09-29

PDF 下载: 英文版 中文版pdf翻译中