基于视觉的分类度量分析及其在不平衡数据中的应用

摘要:选择正确的分类性能度量方法需要仔细考虑,因为有大量可用的度量方法。为了能够明智地做出这个决定,应该研究和比较候选度量方法的一般特性。然而,分析度量方法在其域值的完整范围内是一项困难和具有挑战性的任务。在本研究中,我们尝试用一种专门的可视化技术来支持这种分析,该技术在一个三维四面体中使用重心坐标系。此外,我们将这种技术适应于不平衡数据的情境,并提出了在选择分类性能度量方法时应该考虑的一系列特性。作为结果,我们比较了22个流行的度量方法,并展示了它们的行为差异。此外,对于参数化的度量方法,如F-beta和IBA-alpha(G-mean),我们还分析性地推导出改变度量特性的参数阈值。最后,我们提供了一个在线可视化工具,可以帮助分析性能度量方法的完整域值范围。

作者:Dariusz Brzezinski, Jerzy Stefanowski, Robert Susmaga, Izabela Szczk{e}ch

论文ID:1704.07122

分类:Other Computer Science

分类简称:cs.OH

提交时间:2020-07-30

PDF 下载: 英文版 中文版pdf翻译中