通过多说话者表示改善源分离-arXiv论文预印本中文版

通过多说话者表示改善源分离

摘要：深度学习中解决鸡尾酒会问题方面最新的进展是相当有希望的，也为该领域的进一步研究提供了可能。在神经网络方法中，尚未探索的一种技术是说话人适应。直觉上，我们试图分离的说话人的信息似乎对于说话人分离任务至关重要。然而，由于事先不知道说话人的身份并且有多个说话人同时活动，获取这些说话人信息是具有挑战性的。因此存在某种蛋鸡问题。为了解决这个问题，通过交替估计源信号和i-向量。我们展示了盲目的多说话人适应改进了网络的结果，并且在我们的情况下，网络无法充分有效地获取这些有用的说话人信息。

作者：Jeroen Zegers, Hugo Van hamme

论文ID：1708.08740

分类：Sound

分类简称：cs.SD

提交时间：2017-08-30

PDF 下载： 英文版中文版pdf翻译中