比赛式排除对交叉验证用于接收者操作特征曲线(ROC)分析

摘要:利用比赛的离两位样本探出交叉验证的(ROC) 分析广泛用于评估诊断系统。最近的研究显示,使用标准交叉验证方法来估计ROC曲线下面积(AUC)存在较大的偏差。离开一对样本(LPO)交叉验证已被证明可以纠正这种偏差。然而,虽然LPO能够几乎无偏地估计AUC,但它无法提供为绘制和分析ROC曲线所需的排名。在本研究中,我们提出了一种新方法,称为淘汰两位样本(TLPO)交叉验证。该方法通过将配对比较创建一个比赛来为数据生成排名,从而扩展了LPO。TLPO保留了LPO估计AUC的优势,同时还允许进行ROC分析。我们使用合成和真实世界数据表明TLPO对于AUC估计与LPO一样可靠,并证实了在低维数据上的留一交叉验证中的偏差。

作者:Ileana Montoya Perez, Antti Airola, Peter J. Bostr"om, Ivan Jambor and Tapio Pahikkala

论文ID:1801.09386

分类:Machine Learning

分类简称:stat.ML

提交时间:2018-01-30

PDF 下载: 英文版 中文版pdf翻译中