Surrey-cvssp系统用于DCASE2017挑战赛任务4。

摘要:用于声音场景和事件的检测和分类2017(DCASE2017)挑战的任务4的技术报告方法集。该任务使用弱标记的训练数据评估大规模声音事件的检测系统。数据是YouTube视频摘录,重点关注运输和警告,因为它们在工业应用中具有重要性。有两个任务,音频标记和从弱标记数据中检测声音事件。我们采用了卷积神经网络(CNN)和门控循环单元(GRU)为基本框架。我们提出了一种可学习的门控激活函数来选择信息丰富的局部特征。采用基于注意力的方案来在弱监督模式下定位具体事件。还提出了一种新的批次级平衡策略来解决数据不平衡问题。不同系统的后验融合被发现能够有效提高性能。总结起来,在开发集上,音频标记子任务的F值为61%,声音事件检测子任务的错误率(ER)为0.73。而官方的基于多层感知机(MLP)的基准仅获得了音频标记的13.1%F值和声音事件检测的1.02。

作者:Yong Xu, Qiuqiang Kong, Wenwu Wang, Mark D. Plumbley

论文ID:1709.00551

分类:Sound

分类简称:cs.SD

提交时间:2017-11-28

PDF 下载: 英文版 中文版pdf翻译中