增强预测模型可解释性的变量聚类
摘要:建立易于解释的预测模型的新策略:针对高维数据集和大量高度相关的解释变量,提出了一种新的策略。该策略基于使用CLV方法对变量进行聚类的第一步。通过探索层次聚类树状图,按组选择解释变量。在模型设置实施中,将树状图作为基本学习者用于L2-Boosting过程。该方法被称为lmCLV,通过玩具模拟例子和基于1H-NMR光谱分析的真实案例研究(对橙汁认证)进行了说明。在这两个实例中,该过程显示出与其他方法相似的预测效果,同时具有更强的解释能力。该方法已经在R软件包ClustVarLV中提供。
作者:Evelyne Vigneau
论文ID:2008.07924
分类:Applications
分类简称:stat.AP
提交时间:2023-07-14