MUSAN：一个音乐、语音和噪声语料库-arXiv论文预印本中文版

MUSAN：一个音乐、语音和噪声语料库

摘要：一个新的音乐、语音和噪声的语料库被介绍在这份报告中。这个数据集适用于训练声音活动检测(VAD)和音乐/语音识别模型。我们的语料库在灵活的创作共用许可证下发布。该数据集包括不同类型的音乐、十二种语言的语音，以及各种技术和非技术噪声。我们展示了如何利用这个语料库在广播新闻上进行音乐/语音辨别和说话人识别的声音活动检测(VAD)。

作者：David Snyder, Guoguo Chen, Daniel Povey

论文ID：1510.08484

分类：Sound

分类简称：cs.SD

提交时间：2015-10-30

PDF 下载： 英文版中文版pdf翻译中