深度学习下的音乐生成
摘要:使用深度学习解决文学艺术问题是最近的趋势,并且自动生成音乐已经成为一个活跃的领域。该项目使用原始频域的音频文件生成音乐,依赖于各种LSTM体系结构。使用全连接和卷积层以及LSTM来捕捉频域中的丰富特征,并提高生成音乐的质量。该工作专注于无约束的音乐生成,并且不使用任何关于音乐结构(音符或和弦)的信息来辅助学习。使用不同体系结构生成的音乐使用盲测试进行比较。使用原始音频来训练模型是利用互联网上存在的大量mp3文件的方向,而不需要手动制作结构化的MIDI文件。此外,并非所有音频文件都可以用MIDI文件表示,因此研究这些模型对于未来的发展是一个有趣的前景。
作者:Vasanth Kalingeri, Srikanth Grandhe
论文ID:1612.04928
分类:Sound
分类简称:cs.SD
提交时间:2016-12-16