去随机化Knockoffs:利用e值控制误发现率

摘要:针对高维回归算法,Model-X Knockoffs是一种灵活的封装方法,可提供对误报发现率(FDR)的可控性。由于该方法固有的随机性,同一数据集上的不同运行通常会导致不同的选定变量集,这在实践中是不可取的。本文介绍了一种用于控制可证明FDR的Model-X Knockoffs去随机化方法的方法论。我们提出的方法的关键洞察力在于发现Knockoffs过程实质上是一种e-BH过程。通过利用这种联系,我们通过聚合多个Knockoffs实现得到的e值,去随机化Model-X Knockoffs。我们证明了该去随机化过程可以在没有任何附加条件的情况下控制所需的FDR水平(与此相反,以前提出的去随机化方法无法保证FDR控制)。该方法经过数值实验评估,在与Model-X Knockoffs相比,我们发现该去随机化过程在功率相当的情况下,明显减少了选择的变异性。

作者:Zhimei Ren and Rina Foygel Barber

论文ID:2205.15461

分类:Methodology

分类简称:stat.ME

提交时间:2023-09-01

PDF 下载: 英文版 中文版pdf翻译中