喊叫环境下使用超音段隐马尔可夫模型进行说话人识别

摘要:使用超声段隐马尔可夫模型(SPHMMs)来提高在喧嚣环境下依赖于文本的说话人识别的性能。我们的语音数据库包括两个数据库:我们收集的数据库和“模拟和实际压力下的语音”(SUSAS)数据库。我们的结果表明,与二阶环形隐马尔可夫模型(CHMM2s)相比,SPHMMs显著提高了在喧嚣环境下的说话人识别性能。使用我们收集的数据库,基于CHMM2s和SPHMMs分别在这个环境中的说话人识别性能分别为68%和75%。使用SUSAS数据库,基于CHMM2s和SPHMMs在相同环境中的说话人识别性能分别为71%和79%。

作者:Ismail Shahin

论文ID:1706.09691

分类:Sound

分类简称:cs.SD

提交时间:2017-07-03

PDF 下载: 英文版 中文版pdf翻译中