散布矩阵一致性:用于子集回归的诊断

摘要:线性回归模型直接取决于设计矩阵及其特性。为了解决大规模问题,有效估计模型系数的技术越来越受欢迎,这些技术通过对设计矩阵的行进行划分来适应现代并行计算架构。我们提出了一种简单的度量,用于衡量设计矩阵与其行子集之间的一致性,估计子集何种程度上捕捉到更大数据集的方差-协方差结构。我们在真实世界问题中演示了使用此度量的启发式方法,该方法用于选择行分区大小,平衡统计效率和计算效率的目标。

作者:Michael J. Kane, Bryan Lewis, Sekhar Tatikonda, Simon Urbanek

论文ID:1507.03285

分类:Machine Learning

分类简称:stat.ML

提交时间:2019-07-23

PDF 下载: 英文版 中文版pdf翻译中