喊叫环境下使用超音段隐马尔可夫模型进行说话人识别-arXiv论文预印本中文版

喊叫环境下使用超音段隐马尔可夫模型进行说话人识别

摘要：使用超声段隐马尔可夫模型（SPHMMs）来提高在喧嚣环境下依赖于文本的说话人识别的性能。我们的语音数据库包括两个数据库：我们收集的数据库和“模拟和实际压力下的语音”（SUSAS）数据库。我们的结果表明，与二阶环形隐马尔可夫模型（CHMM2s）相比，SPHMMs显著提高了在喧嚣环境下的说话人识别性能。使用我们收集的数据库，基于CHMM2s和SPHMMs分别在这个环境中的说话人识别性能分别为68％和75％。使用SUSAS数据库，基于CHMM2s和SPHMMs在相同环境中的说话人识别性能分别为71％和79％。

作者：Ismail Shahin

论文ID：1706.09691

分类：Sound

分类简称：cs.SD

提交时间：2017-07-03

PDF 下载： 英文版中文版pdf翻译中