基于新型三阶圆环超音段隐马尔可夫模型的呼喊环境下说话人识别
摘要:在呼喊环境下,文本无关的说话人识别的性能较低。本研究旨在提出、实施和评估新的三阶循环超音节隐马尔可夫模型(CSPHMM3s),以改善呼喊环境下文本无关说话人识别的性能。CSPHMM3s具有循环隐马尔可夫模型(CHMMs)、三阶隐马尔可夫模型(HMM3s)和超音节隐马尔可夫模型(SPHMMs)的综合特征。结果表明,CSPHMM3s优于以下几种模型:一阶从左到右超音节隐马尔可夫模型(LTRSPHMM1s)、二阶从左到右超音节隐马尔可夫模型(LTRSPHMM2s)、三阶从左到右超音节隐马尔可夫模型(LTRSPHMM3s)、一阶循环超音节隐马尔可夫模型(CSPHMM1s)和二阶循环超音节隐马尔可夫模型(CSPHMM2s)。使用我们收集的语音数据库,基于LTRSPHMM1s、LTRSPHMM2s、LTRSPHMM3s、CSPHMM1s、CSPHMM2s和CSPHMM3s的呼喊环境下平均说话人识别性能分别为74.6%、78.4%、81.7%、78.7%、83.4%和85.8%。基于CSPHMM3s达到的说话人识别性能接近于基于人工听者的主观评估。
作者:Ismail Shahin
论文ID:1707.00686
分类:Sound
分类简称:cs.SD
提交时间:2017-07-07