通过对乳腺癌数据的结构学习进行自适应贝叶斯变量聚类
摘要:蛋白质的聚类在癌细胞生物学中是有兴趣的。本文提出了一种基于相关结构的蛋白质(变量)聚类的分层贝叶斯模型。从多元正态似然开始,我们通过使用基于角度的无约束重参数化相关性来强制进行聚类,同时假设截断泊松分布(以惩罚大量的聚类)作为聚类数的先验分布。参数的后验分布没有显式的形式,我们使用可逆跳转马尔可夫链蒙特卡洛(RJMCMC)技术来从后验分布中模拟参数。该方法的最终产品是估计蛋白质(变量)的聚类配置以及聚类数。贝叶斯方法足够灵活,可以对蛋白质进行聚类并估计聚类数。所提出方法的性能通过广泛的模拟研究和一项家族性乳腺癌蛋白表达数据来证实,其中蛋白质来自不同的途径。
作者:Riddhi Pratim Ghosh and Arnab Kumar Maity and Mohsen Pourahmadi and Bani K. Mallick
论文ID:2202.03979
分类:Computation
分类简称:stat.CO
提交时间:2022-02-09