声学反射体定位:新颖的图像源逆转和直接定位方法

摘要:声学反射器定位是音频信号处理中的一个重要问题,其直接应用于空间音频、场景重建和源分离。最近提出了几种方法来估计给定房间冲激响应(RIRs)的声学反射器的三维位置。本文将这些方法划分为“图像源逆转”和“直接定位”两类。我们提出了五个新的贡献。首先,提出了一种称为分群动态规划投影斜率算法的起始检测器,用于自动提取紧凑型麦克风阵列中RIRs中早期反射的到达时间。其次,我们提出了一种使用单个扬声器的图像源逆转方法。它是通过结合图像源定位器(图像源方向和范围算法)和反射器定位器(使用扬声器-图像二分法算法)构建的。第三,我们提出了利用多个扬声器的两个变体。第四,我们提出了一种直接定位方法,利用椭球体的属性来定位反射器的位置。最后,在模拟和实测的RIRs上进行了系统实验,将所提出的方法与最新技术进行了比较。ETSAC通过我们的数据集生成了比其他替代方法更低的误差。然而,ISDAR-LIB组合表现良好,并且运行时间比ETSAC快200倍。

作者:Luca Remaggi and Philip J. B. Jackson and Philip Coleman and Wenwu Wang

论文ID:1610.05653

分类:Sound

分类简称:cs.SD

提交时间:2017-01-06

PDF 下载: 英文版 中文版pdf翻译中