madmom:一个新的Python音频和音乐信号处理库

摘要:毫无疑问,madmom是一个开源的音频处理和音乐信息检索(MIR)库,使用Python编写。madmom采用了简洁、与NumPy兼容的面向对象设计,具备简单的调用规范和合理的默认值,以便快速原型设计MIR应用。原型可以无缝地转化为可调用的处理流程,通过madmom的处理器(Processor)的概念,在多个核上透明运行的可调用对象。处理器还可以被序列化、保存和重新运行,以便在任何地方轻松复现结果。除了低级音频处理外,madmom更注重音乐上有意义的高级特征。其中许多特征采用了机器学习技术,madmom提供了一个模块,实现了一些常用的MIR方法,比如隐马尔可夫模型和神经网络等。此外,madmom还提供了几种最先进的MIR算法,用于音符检测、节拍、下拍和节拍追踪,速度估计和钢琴转录等。这些算法可以轻松地结合到更大的MIR系统中或作为独立程序运行。

作者:Sebastian B"ock, Filip Korzeniowski, Jan Schl"uter, Florian Krebs, Gerhard Widmer

论文ID:1605.07008

分类:Sound

分类简称:cs.SD

提交时间:2016-05-25

PDF 下载: 英文版 中文版pdf翻译中