基于新型三阶圆环超音段隐马尔可夫模型的呼喊环境下说话人识别-arXiv论文预印本中文版

基于新型三阶圆环超音段隐马尔可夫模型的呼喊环境下说话人识别

摘要：在呼喊环境下，文本无关的说话人识别的性能较低。本研究旨在提出、实施和评估新的三阶循环超音节隐马尔可夫模型（CSPHMM3s），以改善呼喊环境下文本无关说话人识别的性能。CSPHMM3s具有循环隐马尔可夫模型（CHMMs）、三阶隐马尔可夫模型（HMM3s）和超音节隐马尔可夫模型（SPHMMs）的综合特征。结果表明，CSPHMM3s优于以下几种模型：一阶从左到右超音节隐马尔可夫模型（LTRSPHMM1s）、二阶从左到右超音节隐马尔可夫模型（LTRSPHMM2s）、三阶从左到右超音节隐马尔可夫模型（LTRSPHMM3s）、一阶循环超音节隐马尔可夫模型（CSPHMM1s）和二阶循环超音节隐马尔可夫模型（CSPHMM2s）。使用我们收集的语音数据库，基于LTRSPHMM1s、LTRSPHMM2s、LTRSPHMM3s、CSPHMM1s、CSPHMM2s和CSPHMM3s的呼喊环境下平均说话人识别性能分别为74.6％、78.4％、81.7％、78.7％、83.4％和85.8％。基于CSPHMM3s达到的说话人识别性能接近于基于人工听者的主观评估。

作者：Ismail Shahin

论文ID：1707.00686

分类：Sound

分类简称：cs.SD

提交时间：2017-07-07

PDF 下载： 英文版中文版pdf翻译中