远距离语音识别的鲁棒性基于连贯性的频谱增强
摘要:CHiME-3的基线语音识别系统前端扩展了基线波束形成器的输出信号的基于相干性的Wiener滤波器。为了计算时域和频域上的后滤波增益,估计基线波束形成器输出的直达和散射信号分量之间的比值,并将其用作短时信噪比的近似值。所提出的谱增强技术通过使用在公共环境中记录的真实语音,评估了CHiME-3挑战基线语音识别系统的词错误率。结果证实,将基于相干性的后滤波器集成到前端信号增强中是有效的。
作者:Hendrik Barfuss, Christian Huemmer, Andreas Schwarz, Walter Kellermann
论文ID:1509.06882
分类:Sound
分类简称:cs.SD
提交时间:2015-09-24