声音感知组织再现的纹理特征-arXiv论文预印本中文版

声音感知组织再现的纹理特征

摘要：基于声源特性，人类对声音进行分类。为了估计这些声源特性，我们提出了一种新的声音分析方法，将声音分离成不同的声音质地：音调、脉冲和宽带噪声。音调或脉冲的听觉存在对应于比仅仅由gamma-chirp滤波器组引入的相关性所能预期的更广泛的耳蜗图案。我们设计了轨迹特征以响应这些扩展图案，并将其用于识别时频平面的音调、脉冲和噪声区域。如果一个区域既不是音调也不是脉冲，那么就标记为噪声。为了调查是否确实存在类似的分离在人类感知组织中，我们引入了基于轨迹的描述符：音長、脈冲性和噪音性。这些描述符追踪被标记为音调、脉冲和噪声的总能量或耳蜗图面积。基于能量的音長和脉冲性与人类主观感知的第一维度强相关，而基于能量的噪音性与第二维度适度相关。我们得出结论，基于能量的音長、脉冲性和噪音性可以很大程度上将谐波、冲击和连续过程声音分离出来。

作者：Ronald A.J. van Elburg and Tjeerd C. Andringa

论文ID：1705.05271

分类：Sound

分类简称：cs.SD

提交时间：2017-05-16

PDF 下载： 英文版中文版pdf翻译中