卷积神经网络在无伴奏合唱声乐中基于得分的音节分割
摘要:将京剧无伴奏歌唱中的乐句分割为音节的一种新的得分知情方法。所提出的方法根据估计的音节起始检测函数(ODF)及其得分估计音节分界的最可能序列。在整篇论文中,我们首先研究了京剧音节的结构,并提出了“音节起始”的定义。然后,我们确定了京剧无伴奏歌唱所面临的挑战。进一步,我们研究了如何利用卷积神经网络(CNN)改进音节ODF的估计。我们提出了一种新颖的CNN架构,可以有效捕捉不同的时间频率尺度用于估计音节起始。此外,我们提出使用得分知情维特比算法来代替阈值化起始函数,因为我们所拥有的音乐知识(得分)可以用来指导维特比算法以克服已经确定的挑战。所提出的方法在京剧无伴奏歌唱的音节分割方面优于现有技术。我们进一步对分割错误进行了分析,并指出了可能的研究方向。
作者:Jordi Pons, Rong Gong, Xavier Serra
论文ID:1707.03544
分类:Sound
分类简称:cs.SD
提交时间:2017-07-13