深度学习下的音乐生成-arXiv论文预印本中文版

深度学习下的音乐生成

摘要：使用深度学习解决文学艺术问题是最近的趋势，并且自动生成音乐已经成为一个活跃的领域。该项目使用原始频域的音频文件生成音乐，依赖于各种LSTM体系结构。使用全连接和卷积层以及LSTM来捕捉频域中的丰富特征，并提高生成音乐的质量。该工作专注于无约束的音乐生成，并且不使用任何关于音乐结构（音符或和弦）的信息来辅助学习。使用不同体系结构生成的音乐使用盲测试进行比较。使用原始音频来训练模型是利用互联网上存在的大量mp3文件的方向，而不需要手动制作结构化的MIDI文件。此外，并非所有音频文件都可以用MIDI文件表示，因此研究这些模型对于未来的发展是一个有趣的前景。

作者：Vasanth Kalingeri, Srikanth Grandhe

论文ID：1612.04928

分类：Sound

分类简称：cs.SD

提交时间：2016-12-16

PDF 下载： 英文版中文版pdf翻译中