通过广义邻接法和EM算法的最大似然估计的系统发生树和替代率

摘要:分子序列数据的研究中的一个核心任务是重建祖先关系。树重建的最常用方法是最大似然(ML)方法。在这种方法中,进化是通过一个基于系统树的离散状态连续时间 Markov 过程来描述的。决定 Markov 过程的替代速率矩阵可以使用期望最大化(EM)算法来估计。然而,对于大数据集进行 ML 系统树的全面搜索在计算上是不可行的。在这种情况下,常常使用邻接法(NJ)方法,因为它具有较快的计算速度。NJ 方法通过基于序列之间的两两比较来递归地将邻近序列进行聚类来重建树。NJ 方法可以推广为基于子树比较而不是相邻距离的重建。在本文中,我们提出了一种同时估计替代速率和重建系统树的算法。该算法在估计替代速率的 EM 算法和重建系统树的广义 NJ 方法之间迭代。该方法的初步结果是令人鼓舞的。

作者:Asger Hobolth and Ruriko Yoshida

论文ID:q-bio/0511034

分类:Quantitative Methods

分类简称:q-bio.QM

提交时间:2007-05-23

PDF 下载: 英文版 中文版pdf翻译中