大规模生存数据下Cox比例风险模型的最优子采样

摘要:大规模生存数据的使用已经在生存分析中变得普遍。本研究提出了一种子采样算法,用于Cox比例风险模型中的时间相关协变量,当样本异常大但计算资源相对有限时。通过最大化加权偏似然估计来开发子样本估计器;表明它具有一致性和渐近正态性。通过最小化子样本估计器的渐近均方误差,得到了具有明确表达的最优子采样概率。仿真研究表明该方法可以令全数据集的估计器满意地近似。然后,将该方法应用于企业贷款和乳腺癌数据集,具有不同的截尾率,结果证实了其实际优势。

作者:Nan Qiao, Wangcheng Li, Feng Xiao, Cunjie Lin and Yong Zhou

论文ID:2302.02286

分类:Computation

分类简称:stat.CO

提交时间:2023-02-07

PDF 下载: 英文版 中文版pdf翻译中