声门波形在语音情感中的贡献:一项比较成对调查

摘要:通过研究声门波形在人类情感表达中的贡献,我们在这项工作中探讨了这一问题。我们考虑了七种情感状态,包括愤怒、喜悦和悲伤这三个情感族群的中度和强烈版本,以及一个中性状态,在普通话中的语音样本中研究。从不同情感状态的语音样本中提取的声门波形首先在时间域和频率域中进行分析,以发现它们的差异。然后基于从原始整个语音信号和只有声门波形信号提取的特征,进行比较情感分类。通过生成基于性能驱动的层次分类器架构和对个别情感状态进行两两分类的实验,证明了从语音信号和声门信号获得的准确度之间的低差异,表明大部分情感线索可以通过声门波形传达。通过声门波形可以最好地区分的情感对是强烈的愤怒和中度的悲伤,准确度为92.45\%。这项工作还得出结论,声门波形比情感的唤起线索更能表达情感的愉悦程度。

作者:Zhongzhe Xiao, Ying Chen, Zhi Tao

论文ID:1808.10144

分类:Sound

分类简称:cs.SD

提交时间:2018-08-31

PDF 下载: 英文版 中文版pdf翻译中