单深度图像下的级联式3D全身姿态回归，每秒100帧-arXiv论文预印本中文版

单深度图像下的级联式3D全身姿态回归，每秒100帧

摘要：使用消费级图像设备（如深度相机）从单个深度图像中准确估计3D姿势仍是一个具有挑战性的问题。本文提出了一种新颖的级联三维全身姿势回归方法，以在100帧每秒的速度下从单个深度图像中估计准确的姿势。关键思想是基于梯度提升算法训练级联回归器，使用预先记录的人体动作捕捉数据库。通过将人体姿势的分层运动学模型纳入学习过程中，我们可以直接估计准确的三维关节角度而不是关节位置。这种模型的最大优势在于在整个三维姿势估计过程中可以保持骨骼长度，从而获得更有效的特征和更高的姿势估计准确性。当与跟踪方法结合使用时，我们的方法可用作初始化过程。我们在CMU动作捕捉数据库、Human3.6M数据集和实时捕捉到的真实人体动作数据上展示了我们方法的实力。与以前的3D姿势估计方法和商业系统（如Kinect 2017）的比较中，我们达到了最先进的精度水平。

作者：Shihong Xia, Zihao Zhang, Le Su

论文ID：1711.08126

分类：Graphics

分类简称：cs.GR

提交时间：2018-01-26

PDF 下载： 英文版中文版pdf翻译中