MAVID:多序列受限祖先对齐

摘要:一种新的全球多序列比对程序的描述:我们描述了一种能够对大量基因组区域进行比对的新全球多序列比对程序。我们的渐进比对方法包括以下思想: 最大似然推断祖先序列,自动构建指导树,基于蛋白质的锚定以从头开始的基因预测,以及从序列的全局同源性图中得出的约束条件。我们已经在MAVID程序中实现了这些想法,该程序能够精确地比对长达兆碱基的多个基因组区域。MAVID能够有效地比对不同的序列,以及不完整未完成的序列。我们在基准CFTR区域上展示了该程序的功能,该区域包括1.8Mb的人类序列和20个有袋类动物、鸟类、鱼类和哺乳类的同源区域。最后,我们描述了两个大规模的MAVID比对:所有可用的HIV基因组的比对和整个人类、小鼠和大鼠基因组的多序列比对。

作者:Nicolas Bray, Lior Pachter

论文ID:q-bio/0311018

分类:Genomics

分类简称:q-bio.GN

提交时间:2007-05-23

PDF 下载: 英文版 中文版pdf翻译中