多元回归的簇弹性网

摘要:多元回归系数的估计中,当响应变量存在聚类结构时,我们提出了一种方法。所提出的方法包括融合惩罚,用于缩小同一聚类中响应的拟合值之间的差异,并使用L1惩罚进行同时变量选择和估计。该方法可用于已知或未知响应变量的分组结构。当聚类结构未知时,该方法将同时估计响应的聚类和回归系数。我们提供了针对受惩罚最小二乘情况的理论结果,包括允许p >> n的渐近结果。我们将我们的方法扩展到响应变量为二项变量的情况。 我们提出了一个坐标下降算法,适用于正态和二项似然,该算法可以轻松扩展到其他广义线性模型(GLM)设置。通过业务运营和基因组学的模拟和数据示例,展示了最小二乘和二项方法的优点。

作者:Bradley S. Price and Ben Sherwood

论文ID:1707.03530

分类:Machine Learning

分类简称:stat.ML

提交时间:2018-03-28

PDF 下载: 英文版 中文版pdf翻译中