分布式麦克风阵列在音频视觉传感器网络中的绝对几何校准
摘要:联合音频-视觉扬声器跟踪需要已知麦克风和摄像机的位置,并以一个公共坐标系给出。然而,传感器自定位算法通常是分别针对声学或视觉模态单独开发的,并以模态特定的坐标系返回其位置,通常在两者之间存在未知的旋转、缩放和平移。在本文中,我们提出了两种基于音频-视觉相关的技术来确定声学传感器在一个公共坐标系中的位置,即通过麦克风和摄像机单独定位的事件。第一种方法是通过估计旋转、缩放和平移,将声学自校准算法的输出映射到视觉坐标系中,而第二种方法是通过声学和视觉到达方向的联合方程组求解。对这两种策略的评估表明,联合校准优于映射方法,并在反射环境中实现了0.20m的总体校准误差。
作者:Florian Jacob and Reinhold Haeb-Umbach
论文ID:1504.03128
分类:Sound
分类简称:cs.SD
提交时间:2015-04-14