卷积神经网络在无伴奏合唱声乐中基于得分的音节分割-arXiv论文预印本中文版

卷积神经网络在无伴奏合唱声乐中基于得分的音节分割

摘要：将京剧无伴奏歌唱中的乐句分割为音节的一种新的得分知情方法。所提出的方法根据估计的音节起始检测函数（ODF）及其得分估计音节分界的最可能序列。在整篇论文中，我们首先研究了京剧音节的结构，并提出了“音节起始”的定义。然后，我们确定了京剧无伴奏歌唱所面临的挑战。进一步，我们研究了如何利用卷积神经网络（CNN）改进音节ODF的估计。我们提出了一种新颖的CNN架构，可以有效捕捉不同的时间频率尺度用于估计音节起始。此外，我们提出使用得分知情维特比算法来代替阈值化起始函数，因为我们所拥有的音乐知识（得分）可以用来指导维特比算法以克服已经确定的挑战。所提出的方法在京剧无伴奏歌唱的音节分割方面优于现有技术。我们进一步对分割错误进行了分析，并指出了可能的研究方向。

作者：Jordi Pons, Rong Gong, Xavier Serra

论文ID：1707.03544

分类：Sound

分类简称：cs.SD

提交时间：2017-07-13

PDF 下载： 英文版中文版pdf翻译中