基于信号建模的相位约束下的复杂非负矩阵分解:音频源分离应用

摘要:音频信号的非负矩阵分解(Nonnegative Matrix Factorization,NMF)是在时频(Time-Frequency,TF)域中分解混合音频信号的强大工具。在源分离框架中,对于每个提取的成分,相位恢复对于合成时域信号是必要的。复数NMF(Complex NMF,CNMF)模型旨在联合估计源的谱图和相位,但需要约束相位以产生令人满意的声音结果。我们提出将基于信号模型的相位约束纳入CNMF框架中:一种鼓励形式的时间相干性的相位展开约束,以及基于音频事件重复的约束,该约束模拟了起始帧内源的相位。我们还提供了用于估计模型参数的算法。实验结果突出了在CNMF框架中包括此类约束对于分离复杂音频混合中的重叠成分的重要性。

作者:Paul Magron, Roland Badeau and Bertrand David

论文ID:1605.07466

分类:Sound

分类简称:cs.SD

提交时间:2016-11-17

PDF 下载: 英文版 中文版pdf翻译中