基于复值高斯过程潜变量模型的融合相位的语音增强

摘要:使用传统的语音增强技术在时频领域修改语音的幅度,并使用噪声语音的相位来合成时域语音。本文提出了一种复值高斯过程潜在变量模型(CGPLVM),用于直接增强复值噪声谱,不仅修改幅度,还修改相位。所开发方法的主要思想是将语音的短时傅里叶变换(STFT)系数建模为加入噪声的适当复高斯过程(GP)。所提出的方法基于将谱投影到低维子空间。使用似然准则来优化模型的超参数。在包含普通话数字零到九的CHTTL数据库上进行了实验。使用了几个标准度量来证明所提出的方法优于基线方法。

作者:Sih-Huei Chen, Yuan-Shan Lee, Jia-Ching Wang

论文ID:1612.09150

分类:Sound

分类简称:cs.SD

提交时间:2017-01-02

PDF 下载: 英文版 中文版pdf翻译中