基于稀疏模型的三方数据聚类方法:Lasso型惩罚

摘要:矩阵高斯分布混合提供了对连续矩阵变量数据进行聚类的概率框架,这种数据在各个领域越来越普遍。尽管这种方法被广泛采用并成功应用,但它存在过参数化问题,使得它即使对于中等大小的矩阵变量数据也不太适用。为了克服这个缺点,我们引入了一种稀疏模型聚类方法用于三维数据。我们的方法假设矩阵混合参数是稀疏的,并且在不同的簇中具有不同的稀疏程度,可以灵活地引入简约性。模型的估计依赖于最大化惩罚似然,其中具有特殊设计的组和图拉索惩罚。这些惩罚能够选择最具信息量的特征,适用于在多个场合记录变量的三维数据聚类,并能够捕捉特定簇的关联结构。我们在合成数据上广泛测试了所提出的方法,并在应用于不同美国城市的时变犯罪模式时证明了其有效性。

作者:Andrea Cappozzo, Alessandro Casa and Michael Fop

论文ID:2307.10673

分类:Computation

分类简称:stat.CO

提交时间:2023-07-21

PDF 下载: 英文版 中文版pdf翻译中