比赛式排除对交叉验证用于接收者操作特征曲线（ROC）分析-arXiv论文预印本中文版

比赛式排除对交叉验证用于接收者操作特征曲线（ROC）分析

摘要：利用比赛的离两位样本探出交叉验证的(ROC) 分析广泛用于评估诊断系统。最近的研究显示，使用标准交叉验证方法来估计ROC曲线下面积(AUC)存在较大的偏差。离开一对样本（LPO）交叉验证已被证明可以纠正这种偏差。然而，虽然LPO能够几乎无偏地估计AUC，但它无法提供为绘制和分析ROC曲线所需的排名。在本研究中，我们提出了一种新方法，称为淘汰两位样本（TLPO）交叉验证。该方法通过将配对比较创建一个比赛来为数据生成排名，从而扩展了LPO。TLPO保留了LPO估计AUC的优势，同时还允许进行ROC分析。我们使用合成和真实世界数据表明TLPO对于AUC估计与LPO一样可靠，并证实了在低维数据上的留一交叉验证中的偏差。

作者：Ileana Montoya Perez, Antti Airola, Peter J. Bostr"om, Ivan Jambor and Tapio Pahikkala

论文ID：1801.09386

分类：Machine Learning

分类简称：stat.ML

提交时间：2018-01-30

PDF 下载： 英文版中文版pdf翻译中