MUSAN:一个音乐、语音和噪声语料库

摘要:一个新的音乐、语音和噪声的语料库被介绍在这份报告中。这个数据集适用于训练声音活动检测(VAD)和音乐/语音识别模型。我们的语料库在灵活的创作共用许可证下发布。该数据集包括不同类型的音乐、十二种语言的语音,以及各种技术和非技术噪声。我们展示了如何利用这个语料库在广播新闻上进行音乐/语音辨别和说话人识别的声音活动检测(VAD)。

作者:David Snyder, Guoguo Chen, Daniel Povey

论文ID:1510.08484

分类:Sound

分类简称:cs.SD

提交时间:2015-10-30

PDF 下载: 英文版 中文版pdf翻译中