基于凸包的多目标遗传编程用于最大化ROC性能
摘要:ROC曲线通常用于分析数据挖掘中分类器的性能。ROC凸包(ROCCH)是经验ROC曲线的最小凸大凹(LCM),覆盖了给定的一组分类器的潜在最优解。一般来说,ROC性能最大化可以被认为是最大化ROCCH,这也意味着在ROC空间中最大化真正阳性率(tpr)并最小化假正性率(fpr)的每个分类器。然而,在ROCCH优化过程中,tpr和fpr彼此冲突。尽管ROCCH最大化问题看起来像是一个多目标优化问题(MOP),但其特殊性质使其与传统MOP不同。在这项工作中,我们将讨论它们之间的区别,并提出基于凸包的多目标遗传编程(CH-MOGP)来解决ROCCH最大化问题。基于凸包的排序是一种指标选择方案,旨在最大化凸包下的面积,它作为一组点的性能的一元指标。描述了一种可以高效实施的选择过程,并遵循与经典超体积优化算法相似的设计原则。我们假设,通过使用量身定制的指标选择方案,CH-MOGP对于ROC凸包逼近比计算所有Pareto最优点的算法更加高效。为了验证我们的假设,我们将新的CH-MOGP与具有经典选择方案的MOGP,包括NSGA-II、MOEA/D和SMS-EMOA进行比较。同时,还将CH-MOGP与传统的机器学习算法,如C4.5、朴素贝叶斯和PRIE进行比较。基于22个知名的UCI数据集的实验结果表明,CH-MOGP显著优于传统的EMOA算法。
作者:Pu Wang, Michael Emmerich, Rui Li, Ke Tang, Thomas Baeck and Xin Yao
论文ID:1303.3145
分类:Neural and Evolutionary Computing
分类简称:cs.NE
提交时间:2013-03-18