大规模基于梯度的混合因子分析器训练-arXiv论文预印本中文版

大规模基于梯度的混合因子分析器训练

摘要：高斯混合模型（GMM）是数据分析中的标准工具。然而，当应用于高维数据（如图像）时，由于所需的完整协方差矩阵（CM）的大小，它们面临问题，而使用对角或球形CM常常会施加过于严重的限制。混合因子分析器（MFA）模型是GMM的一个重要扩展，它允许根据因子载荷的数量$l$在对角线和完整CM之间平滑插值。MFA已成功应用于建模高维图像数据。本文既提供了理论分析，又提供了一种新的高维MFA训练方法，通过随机梯度下降从随机中心初始化开始。这极大地简化了训练和初始化过程，并避免了批处理算法（如期望最大化算法（EM））在大量数据训练时的问题。此外，通过利用矩阵行列式引理的属性，我们证明了MFA的训练和推断/采样可以基于精度矩阵进行，训练完成后不需要矩阵求逆。在训练时，该方法只需要求解大小为$l \times l$的矩阵的逆。除了理论分析和证明，我们还将MFA应用于典型的图像数据集，如SVHN和MNIST，并展示了进行样本生成和异常检测的能力。

作者：Alexander Gepperth

论文ID：2308.13778

分类：Machine Learning

分类简称：cs.LG

提交时间：2023-08-29

PDF 下载： 英文版中文版pdf翻译中