多元回归的簇弹性网
摘要:多元回归系数的估计中,当响应变量存在聚类结构时,我们提出了一种方法。所提出的方法包括融合惩罚,用于缩小同一聚类中响应的拟合值之间的差异,并使用L1惩罚进行同时变量选择和估计。该方法可用于已知或未知响应变量的分组结构。当聚类结构未知时,该方法将同时估计响应的聚类和回归系数。我们提供了针对受惩罚最小二乘情况的理论结果,包括允许p >> n的渐近结果。我们将我们的方法扩展到响应变量为二项变量的情况。 我们提出了一个坐标下降算法,适用于正态和二项似然,该算法可以轻松扩展到其他广义线性模型(GLM)设置。通过业务运营和基因组学的模拟和数据示例,展示了最小二乘和二项方法的优点。
作者:Bradley S. Price and Ben Sherwood
论文ID:1707.03530
分类:Machine Learning
分类简称:stat.ML
提交时间:2018-03-28