贝叶斯方法用于聚类实值、分类和网络数据:变分方法解决方案
摘要:用贝叶斯方法能够将数据聚类问题,包括寻找网络社区等,放入一个系统化的框架中。然而,将贝叶斯方法应用于实际问题可能非常具有挑战性。在大多数情况下,解决方案是通过蒙特卡罗抽样或变分方法来探索的。在这里,我们进一步研究了变分方法在聚类问题中的应用。我们引入了基于隐藏群组结构和先验分布的生成模型。我们扩展了Jaynes的先前工作,并根据对称性论证导出了先验分布。作为案例研究,我们解决了实值数据的双边聚类问题和用超图或二分图表示的数据聚类问题。通过变分计算,并根据数据的起始统计模型,我们得到了变分贝叶斯算法,这是期望最大化算法的广义版本,并带有内置的对模型复杂性或偏置的惩罚。我们通过测试示例展示了变分贝叶斯算法的良好性能。
作者:Alexei Vazquez (Institute for Advanced Study)
论文ID:0805.2689
分类:Data Analysis, Statistics and Probability
分类简称:physics.data-an
提交时间:2008-09-28