音频事件检测相较分类任务更具挑战性的原因是什么?

摘要:音频事件分类比检测更容易处理是一种常见观察。迄今为止,这一观察被接受为事实,我们缺乏仔细的分析。在本文中,我们推理了这一事实背后的原理,并更重要地利用它们来使音频事件检测任务受益。我们提出了一个改进的检测流程,其中添加了一个验证步骤来增强检测系统。这一步骤使用高质量的事件分类器来后处理检测系统输出的良性事件假设,并拒绝误报。为了证明所提出的流程的有效性,我们根据最常见的检测方案和各种事件分类器实现和配对了不同的事件检测器,从标准的词袋模型到最先进的回归器组的模型。在ITC-Irst数据集上的实验结果表明,检测性能得到了显著的改善。更重要的是,这些改善对所有的检测器-分类器组合都是一致的。

作者:Huy Phan, Philipp Koch, Fabrice Katzberg, Marco Maass, Radoslaw Mazur, Ian McLoughlin, Alfred Mertins

论文ID:1612.09089

分类:Sound

分类简称:cs.SD

提交时间:2018-05-18

PDF 下载: 英文版 中文版pdf翻译中