监督声源定位中直达路径相对传递函数的估计
摘要:在嘈杂和混响环境中, 本文解决了单一语音源的双耳定位问题。对于给定的双耳麦克风设置, 与单一源的直接传播相对应的双耳响应是源方向的函数。实际上, 这个响应被噪声和混响所污染。直接传播的相对传递函数(DP-RTF)是两个通道的直接传播声学传递函数的比值。我们提出了一种从嘈杂和混响的麦克风信号中估计DP-RTF的方法, 在短时傅里叶变换域中进行。首先, 采用卷积传递函数逼近来准确表示STFT域中传感器的脉冲响应。其次, 通过使用每个频率和多个帧的自相关和互相关功率谱密度来估计DP-RTF。在存在静态噪声的情况下, 提出了一种帧间频谱减法算法, 可实现估计无噪声的自相关和互相关功率谱密度。最后, 估计得到的DP-RTF被拼接在频率上并用作语音源定位的特征向量。使用模拟和真实数据进行的实验证实, 所提出的定位方法表现良好, 即使在严酷的不利声学条件下, 在大多数声学条件下均优于现有方法的定位方法。
作者:Xiaofei Li, Laurent Girin, Radu Horaud and Sharon Gannot
论文ID:1509.03205
分类:Sound
分类简称:cs.SD
提交时间:2016-09-08