数百种物种串联重复序列的比较分析揭示了着丝粒进化的独特见解

摘要:染色体中枢是染色体分离的必需部分,但其DNA序列演化迅速。在大多数已研究的动植物中,染色体中心区域含有兆碱基尺度的串联重复序列。尽管其重要性,但关于染色体中心区域串联重复是否在不同门派的不同物种之间共享共同特性的了解非常有限。我们使用生物信息学方法,利用公开可获取的基因组序列和我们自己的数据,识别了282个物种中高拷贝的串联重复。假设最丰富的串联重复是染色体中心区域DNA在大多数已经被表征的物种中成立,表明这是基因组的普遍属性。我们的方法与所有当前的测序技术兼容。长的Pacific Biosciences测序读段使我们能够找到长达1,419个碱基的串联重复单体。在几乎所有动植物基因组中都发现了高拷贝的染色体中心区域串联重复,但重复单体的序列组成和长度都具有高度变异性。此外,序列同源性的系统发育分析显示,在约5000万年的分歧后,几乎没有序列保守性的证据。我们发现,尽管整体上缺乏序列保守性,来自不同物种的染色体中心区域串联重复显示出类似的进化模式,包括出现更高阶的重复结构,其中几个多态单体组成一个更大的重复单元。虽然大多数真核生物的染色体中心位置是表观遗传不确定的,我们的结果表明,在动植物的染色体中心区域高度普遍存在串联重复。这表明这些重复序列可能在促进染色体间中心区域DNA的协同进化中扮演功能性角色。

作者:Dani"el P. Melters, Keith R. Bradnam, Hugh A. Young, Natalie Telis, Michael R. May, J. Graham Ruby, Robert Sebra, Paul Peluso, John Eid, David Rank, Jos''e Fernando Garcia, Joseph L. DeRisi, Timothy Smith, Christian Tobias, Jeffrey Ross-Ibarra, Ian F. Korf, Simon W.-L. Chan

论文ID:1209.4967

分类:Genomics

分类简称:q-bio.GN

提交时间:2013-02-12

PDF 下载: 英文版 中文版pdf翻译中