二分类回归树和随机森林中的变量重要性
摘要:二分类回归树中的变量重要性(VIMP)和变量成对关联进行了表征和研究。其中一个关键组成部分是我们所称之为最大子树的节点均方误差。该理论自然地从单个树扩展到树的集合,并适用于随机森林等方法。这对于随机森林中的重要性值非常有用,例如用于对生物信息学中的高通量基因组数据进行筛选,但关于它们的性质几乎没有理论存在。
作者:Hemant Ishwaran
论文ID:0711.2434
分类:Machine Learning
分类简称:stat.ML
提交时间:2009-09-29