使用MFCC多通道方法鉴别带有衰老因素的声音表达

摘要:通过声音话语,试图识别因老化因素引起的变化。通过 MFCC (Mel Frequency Cepstrum Coefficient) 提取与老化因素相关的声音变化。然而,受到老化因素影响的声音特征的兼容性水平可能下降到55%,而未受到影响的声音特征可能达到95%。为了提高受老化因素影响的语音特征的兼容性,开发了更具体的特征提取方法:将语音分成多个通道,建议使用多通道5滤波器组(M5FB)、多通道2滤波器组(M2FB)和多通道1滤波器组(M1FB)的MFCC多通道方法。测试结果显示,对于具有25年间隔的模型M5FB和M2FB,在兼容性水平方面得分最高,分别为85%和82%。而在10年时间间隔上,模型M5FB获得了最高得分86%。

作者:Roy Rudolf Huizen, Jazi Eko Istiyanto, Agfianto Eko Putra

论文ID:1702.01999

分类:Sound

分类简称:cs.SD

提交时间:2017-02-08

PDF 下载: 英文版 中文版pdf翻译中