深度重混:使用卷积深度神经网络重新混合音乐混合物

摘要:音频源分离是一个困难的机器学习问题,其性能是通过比较提取的信号与组成源信号进行衡量的。然而,如果分离的动机是为了重新混音,那么完全分离并不是必要的,因此分离的困难程度和分离质量取决于重新混音的性质。在这里,我们使用一个经过训练的卷积深度神经网络(DNN),来估计将音乐中的声音与音乐分离的“理想”二值掩码,通过直接操作音乐混合频谱的各个幅度分量来进行声音平衡的重新混音。我们的结果表明,可以对最终的重新混音应用非常小的声音增益变化,而几乎不会产生失真。我们的方法可以用于重新混音现有的混音作品。

作者:Andrew J.R Simpson, Gerard Roma, Mark D. Plumbley

论文ID:1505.00289

分类:Sound

分类简称:cs.SD

提交时间:2015-05-05

PDF 下载: 英文版 中文版pdf翻译中