分布式麦克风阵列在音频视觉传感器网络中的绝对几何校准-arXiv论文预印本中文版

分布式麦克风阵列在音频视觉传感器网络中的绝对几何校准

摘要：联合音频-视觉扬声器跟踪需要已知麦克风和摄像机的位置，并以一个公共坐标系给出。然而，传感器自定位算法通常是分别针对声学或视觉模态单独开发的，并以模态特定的坐标系返回其位置，通常在两者之间存在未知的旋转、缩放和平移。在本文中，我们提出了两种基于音频-视觉相关的技术来确定声学传感器在一个公共坐标系中的位置，即通过麦克风和摄像机单独定位的事件。第一种方法是通过估计旋转、缩放和平移，将声学自校准算法的输出映射到视觉坐标系中，而第二种方法是通过声学和视觉到达方向的联合方程组求解。对这两种策略的评估表明，联合校准优于映射方法，并在反射环境中实现了0.20m的总体校准误差。

作者：Florian Jacob and Reinhold Haeb-Umbach

论文ID：1504.03128

分类：Sound

分类简称：cs.SD

提交时间：2015-04-14

PDF 下载： 英文版中文版pdf翻译中