自适应数据双重稳健估计的统计推断与生存结果

摘要:生存分析的双重稳健估计器的一致性依赖于至少两个无效回归参数的一致估计。在中等到大规模的维度下,使用灵活的数据自适应回归估计器可以帮助实现这种一致性。然而,如果其中一个无效估计器是不一致的,那么双重稳健估计器的$n^{1/2}$-一致性不能得到保证。在本文中,我们提出了一种双重稳健估计器,其新颖之处在于它以$n^{1/2}$-速率收敛于一个高斯变量,适用于大类数据自适应估计器的无效参数,前提是至少有一个参数以$n^{1/4}$-速率一致估计。这一结果通过对半参数推断的最近思想进行调整实现,其中包括:(i)将在双重稳健估计器的渐近分析中出现的漂移项高斯化(即,使其渐近线性化),(ii)使用交叉匹配避免对无效估计器的熵条件。我们给出了估计器的渐近方差公式,从而可以计算双重稳健置信区间和p值。我们通过模拟研究展示了估计器的有限样本性质,并在一个III期临床试验中演示了它在治疗HER2阳性乳腺癌新疗法效果估计中的应用。

作者:Iv''an D''iaz

论文ID:1709.00401

分类:Machine Learning

分类简称:stat.ML

提交时间:2019-01-30

PDF 下载: 英文版 中文版pdf翻译中