含有大量缺失值的因子分析中的全信息最大似然估计-arXiv论文预印本中文版

含有大量缺失值的因子分析中的全信息最大似然估计

摘要：在大多数数据值缺失的情况下，我们考虑因子分析模型中全信息最大似然(FIML)估计的问题。期望最大化(EM)算法通常用于寻找FIML估计值，其中观察变量上的缺失值包含在完整数据中。然而，当观测值数量较大和/或涉及大量缺失值时，EM算法的计算成本非常高。在本文中，我们提出了一种基于EM算法但可以高效计算FIML估计的新算法。通过不将观察变量上的缺失值视为完整数据的一部分，实现了计算速度的显着提高。我们将该算法应用于从问卷调查中收集的有关人类第一印象的真实数据集中，几乎有90％的数据值缺失。当存在许多缺失数据值时，即使观测值数量很大，也不清楚FIML过程是否可以实现良好的估计精度。为了调查这一点，我们进行了蒙特卡洛模拟，涵盖了多种样本大小。

作者：Kei Hirose, Sunyong Kim, Yutaka Kano, Miyuki Imada, Manabu Yoshida and Masato Matsuo

论文ID：1312.5458

分类：Computation

分类简称：stat.CO

提交时间：2013-12-20

PDF 下载： 英文版中文版pdf翻译中