散布矩阵一致性:用于子集回归的诊断
摘要:线性回归模型直接取决于设计矩阵及其特性。为了解决大规模问题,有效估计模型系数的技术越来越受欢迎,这些技术通过对设计矩阵的行进行划分来适应现代并行计算架构。我们提出了一种简单的度量,用于衡量设计矩阵与其行子集之间的一致性,估计子集何种程度上捕捉到更大数据集的方差-协方差结构。我们在真实世界问题中演示了使用此度量的启发式方法,该方法用于选择行分区大小,平衡统计效率和计算效率的目标。
作者:Michael J. Kane, Bryan Lewis, Sekhar Tatikonda, Simon Urbanek
论文ID:1507.03285
分类:Machine Learning
分类简称:stat.ML
提交时间:2019-07-23