一种具有跳过滤波连接的递归编码器-解码器方法用于单声道歌声分离
摘要:使用基于编码器-解码器架构的深度学习方法进行音乐源分离的目标是近似于理想的时频掩蔽或目标音乐源的频谱表示。然后利用这些频谱表示来导出时频掩蔽。在这项工作中,我们介绍了一种直接从观察到的混合幅度谱学习时频掩蔽的方法。我们使用循环神经网络并仅使用目标源的幅度谱的先验知识来训练它们。为了评估所提方法的性能,我们专注于唱歌声分离任务。客观评估的结果表明,我们提出的方法提供了与基于深度学习的方法相当的结果,这些方法在复杂的信号表示上运作。与近似时频掩蔽的先前方法相比,我们的方法将信号失真比的性能提高了平均3.8 dB。
作者:Stylianos Ioannis Mimilakis, Konstantinos Drossos, Tuomas Virtanen, Gerald Schuller
论文ID:1709.00611
分类:Sound
分类简称:cs.SD
提交时间:2018-04-25