GTZAN数据集:内容、缺陷、对评估的影响及其未来使用

摘要:GTZAN数据集在至少100篇发表的作品中出现,并且是用于音乐流派识别(MGR)的机器听力研究中最常用的公共数据集。然而,我们最近的工作显示GTZAN有几个缺点(重复、错误标签和畸变),这些缺点挑战了使用它导出的任何结果的可解释性。在本文中,我们否定了所有MGR系统都受到这些缺点的影响,以及GTZAN中MGR系统的性能仍然有意义可比,因为它们都面临着相同的缺点的论断。我们查明并分析了GTZAN的内容,并提供了其缺点的目录。我们回顾了GTZAN在MGR研究中的使用情况,并发现很少有迹象表明它的缺点已经被知晓和考虑过。最后,我们对其缺点对评估五种不同MGR系统的影响进行了严格研究。教训不是放弃GTZAN,而是在考虑其内容时使用它。

作者:Bob L. Sturm

论文ID:1306.1461

分类:Sound

分类简称:cs.SD

提交时间:2015-05-18

PDF 下载: 英文版 中文版pdf翻译中