随机森林中协变量角色的网络流可视化方法

摘要:使用并行坐标图和桑基图来表示随机森林中交互协变效应的层次结构的新应用。每个可视化都总结了随机森林中所有树的所有路径的频率。随机森林中协变量的角色的可视化包括:排序的条形图或点图,描述单个协变量对随机森林预测准确性的贡献的标量度量;线图,描述改变特定协变量对随机森林预测的影响的各种摘要;热图,显示所有协变量对之间交互强度的度量;并行坐标图,为每个响应类描绘在预测属于该类的观测中最具代表性的所有协变量值的分布。这些可视化通过提供对随机森林中协变量的角色的深入洞察,但不会传达协变量效应在随机森林中的层次结构的频率或协变量在这些层次结构中的出现顺序。我们的可视化填补了这些空白。我们使用一个适用于公共可用数据的随机森林来演示我们的可视化,并提供一个R包的软件实现。

作者:Benjamin R. Fitzpatrick and Kerrie Mengersen

论文ID:1706.08702

分类:Other Statistics

分类简称:stat.OT

提交时间:2017-06-28

PDF 下载: 英文版 中文版pdf翻译中