人类和高等灵长类基因组的非对齐比较

摘要:基于k-mer评分的组成光谱(CS)分析被应用于人类和灵长类基因组的点图比较。检测到的扩展保守的共生区域是基于连续模糊相似性而不是离散锚定点(基因或高度保守的非编码元素)的链。除了在整个基因组序列比较中找到的高对应性外,在屏蔽基因序列之后也找到了很好的相似性,这表明CS分析能够揭示基因组序列的非编码部分,包括重复DNA和基因组的“暗物质”的系统发育信号。显然,揭示平行排序的可能性取决于共同祖先序列在比较的基因组相应片段上的本地变化信号。我们探索了两个贡献此信号的来源:序列组成(GC含量)和序列组织(通常的A、T、G、C或嘌呤-嘧啶字母表中k-mer丰度)。基于分析序列上的GC分布的整个基因组比较确实给出了合理的结果,但将其与k-mer丰度相结合,可以显著提高排序质量,表明组成和组织的异质性构成了信息的互补来源,用于基因组序列的进化保守相似性。

作者:V.M. Kirzhner, S. Frenkel, A.B. Korol

论文ID:1111.6172

分类:Genomics

分类简称:q-bio.GN

提交时间:2011-12-02

PDF 下载: 英文版 中文版pdf翻译中