人类X染色体和Y染色体卫星阵列的着丝点参考模型
摘要:人类基因组仍然不完整,其中包含着内源性着丝粒和其他异染色质区域的数兆碱基的缺失。这些区域通常富集有长串几乎相同的串联重复序列,称为卫星DNA,为区分数百万碱基上的重复位点提供了有限的变异位点。这种相当的序列同质性对可用的组装策略构成了挑战,因此,着丝粒区域在进行中的基因组研究中被省略。为解决这个问题,我们在X和Y染色体上呈现了一个局部有序的组装,得到了在个体基因组中3.83 Mb的着丝粒DNA的初始线性表示。为了进一步扩展每个着丝粒参考序列的实用性,我们评估了数组中的位点在短读映射性和染色体特异性方面的情况。由于卫星DNA以集体方式进化,我们利用这些着丝粒组装来评估来自不同人类群体的372个个体之间序列变异的程度。在这样做的过程中,我们通过数组长度和序列组成确定了X和Y着丝粒中的两个古老的卫星数组变异。这项研究提供了一个区域着丝粒的初始线性表示和全面的序列特征描述,并为将基因组特征扩展到这些位点以及复杂基因组中的其他重复丰富区域奠定了基础。
作者:Karen H. Miga, Yulia Newton, Miten Jain, Nicolas Altemose, Huntington F. Willard and W. James Kent
论文ID:1307.0035
分类:Genomics
分类简称:q-bio.GN
提交时间:2013-10-28