基于复值高斯过程潜变量模型的融合相位的语音增强-arXiv论文预印本中文版

基于复值高斯过程潜变量模型的融合相位的语音增强

摘要：使用传统的语音增强技术在时频领域修改语音的幅度，并使用噪声语音的相位来合成时域语音。本文提出了一种复值高斯过程潜在变量模型（CGPLVM），用于直接增强复值噪声谱，不仅修改幅度，还修改相位。所开发方法的主要思想是将语音的短时傅里叶变换（STFT）系数建模为加入噪声的适当复高斯过程（GP）。所提出的方法基于将谱投影到低维子空间。使用似然准则来优化模型的超参数。在包含普通话数字零到九的CHTTL数据库上进行了实验。使用了几个标准度量来证明所提出的方法优于基线方法。

作者：Sih-Huei Chen, Yuan-Shan Lee, Jia-Ching Wang

论文ID：1612.09150

分类：Sound

分类简称：cs.SD

提交时间：2017-01-02

PDF 下载： 英文版中文版pdf翻译中