接近核函数中时间上下文的重要性:声音分离案例研究

摘要:音乐源分离方法利用源特定的频谱特征来促进分解过程。核心增加模块(KAM)将鲁棒统计应用于时频bin,由源特定的核函数来指定,该函数定义了bin之间的相似性。现有方法中的核函数通常使用单个时间帧之间的度量定义。然而,在噪声和其他声源存在的情况下,单帧的信息往往是不可靠的,经常会选择错误的帧作为相似的帧。在本文中,我们将时间上下文引入核函数中,提供额外的信息,稳定相似性搜索。在人声分离的背景下进行评估,我们的简单扩展与之前的核函数相比,明显改善了分离质量。

作者:Delia Fano Yela, Sebastian Ewert, Derry FitzGerald, Mark Sandler

论文ID:1702.02130

分类:Sound

分类简称:cs.SD

提交时间:2017-11-01

PDF 下载: 英文版 中文版pdf翻译中