声音感知组织再现的纹理特征
摘要:基于声源特性,人类对声音进行分类。为了估计这些声源特性,我们提出了一种新的声音分析方法,将声音分离成不同的声音质地:音调、脉冲和宽带噪声。音调或脉冲的听觉存在对应于比仅仅由gamma-chirp滤波器组引入的相关性所能预期的更广泛的耳蜗图案。我们设计了轨迹特征以响应这些扩展图案,并将其用于识别时频平面的音调、脉冲和噪声区域。如果一个区域既不是音调也不是脉冲,那么就标记为噪声。为了调查是否确实存在类似的分离在人类感知组织中,我们引入了基于轨迹的描述符:音長、脈冲性和噪音性。这些描述符追踪被标记为音调、脉冲和噪声的总能量或耳蜗图面积。基于能量的音長和脉冲性与人类主观感知的第一维度强相关,而基于能量的噪音性与第二维度适度相关。我们得出结论,基于能量的音長、脉冲性和噪音性可以很大程度上将谐波、冲击和连续过程声音分离出来。
作者:Ronald A.J. van Elburg and Tjeerd C. Andringa
论文ID:1705.05271
分类:Sound
分类简称:cs.SD
提交时间:2017-05-16