复合分位数回归中的最优子采样算法与分布式数据

摘要:多机器存储的大规模数据中,我们提出一种用于复合分位数回归的分布式子采样过程。通过从一个通用子采样算法中建立复合分位数回归估计器的一致性和渐近正态性,我们推导出L-最优准则下的最优子采样概率和最优分配大小。我们开发了一个两步算法来近似最优子采样过程。通过模拟和真实数据集的数值实验来说明所提出的方法。

作者:Xiaohui Yuan, Shiting Zhou, Yue Wang

论文ID:2301.02448

分类:Computation

分类简称:stat.CO

提交时间:2023-01-09

PDF 下载: 英文版 中文版pdf翻译中