基于信号建模的相位约束下的复杂非负矩阵分解:音频源分离应用
摘要:音频信号的非负矩阵分解(Nonnegative Matrix Factorization,NMF)是在时频(Time-Frequency,TF)域中分解混合音频信号的强大工具。在源分离框架中,对于每个提取的成分,相位恢复对于合成时域信号是必要的。复数NMF(Complex NMF,CNMF)模型旨在联合估计源的谱图和相位,但需要约束相位以产生令人满意的声音结果。我们提出将基于信号模型的相位约束纳入CNMF框架中:一种鼓励形式的时间相干性的相位展开约束,以及基于音频事件重复的约束,该约束模拟了起始帧内源的相位。我们还提供了用于估计模型参数的算法。实验结果突出了在CNMF框架中包括此类约束对于分离复杂音频混合中的重叠成分的重要性。
作者:Paul Magron, Roland Badeau and Bertrand David
论文ID:1605.07466
分类:Sound
分类简称:cs.SD
提交时间:2016-11-17