基于模型的基因表达数据聚类的 Gibbs 采样方法分析
摘要:基于模型的基因聚类算法在大规模数据集上的性质还不太清楚,我们对琥珀酸酵母(S.cerevisiae)的基因表达数据进行了扩展分析。该算法使用贝叶斯方法和吉布斯采样过程来迭代更新每个基因和条件的聚类分配。在大规模数据集上,后验分布在有限数量的等概率聚类之间具有尖峰。GO注释分析显示这些局部极大值都具有相等的生物学意义,并且同时对基因和条件进行聚类比仅对基因进行聚类并假设条件相互独立要好。我们通过在基因集合上提取加权图,将一系列不同的等价聚类汇总为模糊、重叠的聚类。这些模糊聚类的核心包含紧密共表达基因的紧凑集,而重叠部分展示了仅部分共表达的基因之间的关系。
作者:Anagha Joshi, Yves Van de Peer, Tom Michoel
论文ID:0801.2033
分类:Quantitative Methods
分类简称:q-bio.QM
提交时间:2008-01-15