基于模型的音频源分离的STFT相位恢复-arXiv论文预印本中文版

基于模型的音频源分离的STFT相位恢复

摘要：频域音频分离中基于短时傅里叶变换（STFT）估计每个源的幅度是常见的。为了进一步合成时域信号，需要恢复相应复值STFT的相位。该领域的大多数作者选择韦纳样滤波方法，即使用原始混合音频的相位。本文采用不同的观点。许多音乐事件部分由缓慢变化的正弦波组成，这些频率成分的STFT相位随时间变化呈特定形式。在获得短期频率估计后，这允许通过展开技术进行相位恢复。本文提出了一种新颖的迭代源分离过程，建立在这些结果之上。它通过辅助函数方法最小化混合误差。该过程通过利用展开技术进行初始化，以生成受益于时间连续性的估计。在真实的音乐片段上进行的实验证明，基于准确幅度估计的该过程优于最先进的一致性韦纳滤波器。

作者：Paul Magron and Roland Badeau and Bertrand David

论文ID：1608.01953

分类：Sound

分类简称：cs.SD

提交时间：2018-02-28

PDF 下载： 英文版中文版pdf翻译中