多元回归的簇弹性网-arXiv论文预印本中文版

多元回归的簇弹性网

摘要：多元回归系数的估计中，当响应变量存在聚类结构时，我们提出了一种方法。所提出的方法包括融合惩罚，用于缩小同一聚类中响应的拟合值之间的差异，并使用L1惩罚进行同时变量选择和估计。该方法可用于已知或未知响应变量的分组结构。当聚类结构未知时，该方法将同时估计响应的聚类和回归系数。我们提供了针对受惩罚最小二乘情况的理论结果，包括允许p >> n的渐近结果。我们将我们的方法扩展到响应变量为二项变量的情况。我们提出了一个坐标下降算法，适用于正态和二项似然，该算法可以轻松扩展到其他广义线性模型（GLM）设置。通过业务运营和基因组学的模拟和数据示例，展示了最小二乘和二项方法的优点。

作者：Bradley S. Price and Ben Sherwood

论文ID：1707.03530

分类：Machine Learning

分类简称：stat.ML

提交时间：2018-03-28

PDF 下载： 英文版中文版pdf翻译中