通过多说话者表示改善源分离
摘要:深度学习中解决鸡尾酒会问题方面最新的进展是相当有希望的,也为该领域的进一步研究提供了可能。在神经网络方法中,尚未探索的一种技术是说话人适应。直觉上,我们试图分离的说话人的信息似乎对于说话人分离任务至关重要。然而,由于事先不知道说话人的身份并且有多个说话人同时活动,获取这些说话人信息是具有挑战性的。因此存在某种蛋鸡问题。为了解决这个问题,通过交替估计源信号和i-向量。我们展示了盲目的多说话人适应改进了网络的结果,并且在我们的情况下,网络无法充分有效地获取这些有用的说话人信息。
作者:Jeroen Zegers, Hugo Van hamme
论文ID:1708.08740
分类:Sound
分类简称:cs.SD
提交时间:2017-08-30