使用MFCC多通道方法鉴别带有衰老因素的声音表达
摘要:通过声音话语,试图识别因老化因素引起的变化。通过 MFCC (Mel Frequency Cepstrum Coefficient) 提取与老化因素相关的声音变化。然而,受到老化因素影响的声音特征的兼容性水平可能下降到55%,而未受到影响的声音特征可能达到95%。为了提高受老化因素影响的语音特征的兼容性,开发了更具体的特征提取方法:将语音分成多个通道,建议使用多通道5滤波器组(M5FB)、多通道2滤波器组(M2FB)和多通道1滤波器组(M1FB)的MFCC多通道方法。测试结果显示,对于具有25年间隔的模型M5FB和M2FB,在兼容性水平方面得分最高,分别为85%和82%。而在10年时间间隔上,模型M5FB获得了最高得分86%。
作者:Roy Rudolf Huizen, Jazi Eko Istiyanto, Agfianto Eko Putra
论文ID:1702.01999
分类:Sound
分类简称:cs.SD
提交时间:2017-02-08