基于规则集的预测学习

摘要:一种构建普通回归和分类模型的方法是将其构建为从数据中得出的简单规则的线性组合。每条规则由一小组有关输入变量值的简单语句的连接构成。这些规则集显示出与最佳方法相当的预测准确性。然而,它们的主要优势在于解释性。由于其简单形式,每个规则都容易理解,以及其对个别预测、选择性预测子集或整个联合输入变量值空间的全局影响。类似地,可以全局评估各自输入变量的相关程度,在输入空间的不同区域局部评估,或在个别预测点评估。介绍了用于自动识别与其他变量相互作用的变量,以及这些相互作用的强度和程度,以及与其相互作用的其他变量的身份的技术。使用图形表示来可视化主要效应和相互作用效应。

作者:Jerome H. Friedman, Bogdan E. Popescu

论文ID:0811.1679

分类:Applications

分类简称:stat.AP

提交时间:2008-11-12

PDF 下载: 英文版 中文版pdf翻译中