电话应用中使用MFCC进行性别识别 - 一项比较研究
摘要:性别识别是自动语音识别和交互式语音应答系统的重要组成部分。确定说话者的性别可减轻系统的计算负担,减少进一步处理的需要。从语音中识别性别的典型方法主要依赖于特征提取和分类过程。本研究的目的是评估各种最先进的分类方法的性能,并调整其参数,以帮助选择最佳的性别识别任务分类方法。综合评估了包括k近邻、朴素贝叶斯、多层感知器、随机森林和支持向量机在内的五种分类方案,使用Mel频率倒谱系数从电话语音中确定性别。进行了不同的实验,以确定训练数据大小、语音流长度和参数调整对分类性能的影响。结果表明,在所有五种方案中,支持向量机是最佳的性别识别分类器。
作者:Jamil Ahmad, Mustansar Fiaz, Soon-il Kwon, Maleerat Sodanil, Bay Vo, and Sung Wook Baik
论文ID:1601.01577
分类:Sound
分类简称:cs.SD
提交时间:2016-01-08