基于字典学习和源恢复的多样音频源分类方法-arXiv论文预印本中文版

基于字典学习和源恢复的多样音频源分类方法

摘要：基于字典学习的音频源分类算法被提出，用于将一个样本音频信号分类为有限的不同音频源之一。在字典学习过程中，采用余弦相似度度量来选择原子。根据提出的三个客观指标，即信号失真比（SDR），非零权重的数量和权重的总和，对于十二种不同的音频源，获得了98.2％的逐帧源分类准确性。对于测试的十个音频源，使用连续六帧上积累的移动SDR获得了百分百的准确度，而另外两个音频源需要累积10和14帧。

作者：K V Vijay Girish, T V Ananthapadmanabha and A G Ramakrishnan

论文ID：1510.07774

分类：Sound

分类简称：cs.SD

提交时间：2015-10-28

PDF 下载： 英文版中文版pdf翻译中