Bregman散度相位恢复及其在音频信号恢复中的应用
摘要:相位恢复(PR)旨在从一组内积的幅度中恢复信号。这个问题出现在许多音频信号处理应用中,这些应用在短时傅里叶变换幅度或功率谱图上操作,并丢弃相位信息。从结果修饰后的谱图中恢复缺失的相位确实是合成时域信号所必需的。PR通常通过考虑涉及二次损失函数的最小化问题来解决。在本文中,我们采取了不同的立场。事实上,二次损失函数不能很好地考虑音频的一些感知特性,在许多情况下,人们更喜欢选择一些替代的beta-差异度量。因此,我们将PR表述为涉及Bregman差异的新的最小化问题。由于这些差异一般来说不对它们的两个输入参数对称,它们导致了两种不同的问题表述。为了优化得到的目标函数,我们推导出了基于加速梯度下降和交替方向乘数法的两种算法。通过对从谱图恢复的音频信号进行的实验,这些谱图可以是精确的或从噪声观测中估计得到的,我们展示了我们提出的方法在音频恢复方面的潜力。特别是,在非常嘈杂的条件下,利用一些这些Bregman差异能够比二次损失获得更好的PR性能。
作者:Pierre-Hugo Vial, Paul Magron, Thomas Oberlin, C\'edric F\'evotte
论文ID:2010.00392
分类:Sound
分类简称:cs.SD
提交时间:2021-02-24