综合多元线性回归子集选择和验证的数学规划方法

摘要:多元线性回归的子集选择旨在通过选择少量解释变量来构建最小错误的回归模型。构建模型后,进行各种统计检验和诊断以验证模型,并确定回归假设是否满足。大多数传统方法在这一步骤需要人工决策。例如,用户添加或删除变量直到获得满意的模型。然而,这种试错策略不能保证找到一个同时最小化误差并满足所有回归假设的子集。在本文中,我们提出了一种基于数学规划的多元线性回归子集选择的完全自动化模型构建过程,该模型集成了模型构建和验证。所提出的模型最小化均方误差,同时确保满足大部分重要的回归假设。我们还提出了一种有效的约束来近似系数t检验的约束。当没有任何子集满足所有考虑的回归假设时,我们的模型提供了一个满足大部分这些假设的替代子集。计算结果表明,与最先进的基准模型相比,我们的模型产生更好的解(即满足更多回归假设),同时保持相似的解释能力。

作者:Seokhyun Chung, Young Woong Park, Taesu Cheong

论文ID:1712.04543

分类:Machine Learning

分类简称:stat.ML

提交时间:2020-09-04

PDF 下载: 英文版 中文版pdf翻译中