基于模型的音频源分离的STFT相位恢复
摘要:频域音频分离中基于短时傅里叶变换(STFT)估计每个源的幅度是常见的。为了进一步合成时域信号,需要恢复相应复值STFT的相位。该领域的大多数作者选择韦纳样滤波方法,即使用原始混合音频的相位。本文采用不同的观点。许多音乐事件部分由缓慢变化的正弦波组成,这些频率成分的STFT相位随时间变化呈特定形式。在获得短期频率估计后,这允许通过展开技术进行相位恢复。本文提出了一种新颖的迭代源分离过程,建立在这些结果之上。它通过辅助函数方法最小化混合误差。该过程通过利用展开技术进行初始化,以生成受益于时间连续性的估计。在真实的音乐片段上进行的实验证明,基于准确幅度估计的该过程优于最先进的一致性韦纳滤波器。
作者:Paul Magron and Roland Badeau and Bertrand David
论文ID:1608.01953
分类:Sound
分类简称:cs.SD
提交时间:2018-02-28