听觉对象:用于识别的生物启发的分层稀疏高维表示
摘要:听觉信号在高维空间中的分层结构、独立性和稀疏性方面,强调对信息表示的重要性,以定义听觉对象的组成部分。引入了听觉对象及其神经表示的概念。然后进行了具有说明性的应用,包括对各种听觉信号(语音、音乐和自然室外环境)的分析。随后提出了一个新的自动语音识别(ASR)系统,并与传统统计系统进行了比较。所提出的系统清楚地表明,基于对象的分析为语音识别任务提供了很大的灵活性和鲁棒性。从神经科学和声学信号处理的知识融合在一起,为声学信号分类领域带来了新的思考方式。
作者:Simon Brodeur and Jean Rouat
论文ID:1311.5924
分类:Sound
分类简称:cs.SD
提交时间:2013-11-26