基于字典学习和源恢复的多样音频源分类方法

摘要:基于字典学习的音频源分类算法被提出,用于将一个样本音频信号分类为有限的不同音频源之一。在字典学习过程中,采用余弦相似度度量来选择原子。根据提出的三个客观指标,即信号失真比(SDR),非零权重的数量和权重的总和,对于十二种不同的音频源,获得了98.2%的逐帧源分类准确性。对于测试的十个音频源,使用连续六帧上积累的移动SDR获得了百分百的准确度,而另外两个音频源需要累积10和14帧。

作者:K V Vijay Girish, T V Ananthapadmanabha and A G Ramakrishnan

论文ID:1510.07774

分类:Sound

分类简称:cs.SD

提交时间:2015-10-28

PDF 下载: 英文版 中文版pdf翻译中