增强预测模型可解释性的变量聚类-arXiv论文预印本中文版

增强预测模型可解释性的变量聚类

摘要：建立易于解释的预测模型的新策略：针对高维数据集和大量高度相关的解释变量，提出了一种新的策略。该策略基于使用CLV方法对变量进行聚类的第一步。通过探索层次聚类树状图，按组选择解释变量。在模型设置实施中，将树状图作为基本学习者用于L2-Boosting过程。该方法被称为lmCLV，通过玩具模拟例子和基于1H-NMR光谱分析的真实案例研究（对橙汁认证）进行了说明。在这两个实例中，该过程显示出与其他方法相似的预测效果，同时具有更强的解释能力。该方法已经在R软件包ClustVarLV中提供。

作者：Evelyne Vigneau

论文ID：2008.07924

分类：Applications

分类简称：stat.AP

提交时间：2023-07-14

PDF 下载： 英文版中文版pdf翻译中