人类Y染色体基因分类使用分形维度和香农熵

摘要:人类Y染色体上的所有基因都使用分形维度和Shannon熵进行了研究。找到了明确的异常聚类。其中有6个序列被撤销为编码DNA序列,还有1个额外的序列没有在当前的组装中。开发了一种基于偏离平均FD和SE值的序列排名方法。在得分排名最高的10\%偏离群体中,这组序列极有可能来自着丝点或伪性染色体区域,而来自X染色体转座区域的可能性较低。在异常值中,还富集了lncRNA序列。此外,先前已确定用于进化研究的表达基因数倾向于与平均值没有大的偏离。 关键词:Y染色体;Shannon二核苷酸熵;分形维度;着丝点基因;基因退化;lncRNA

作者:Todd Holden and JianMin Ye

论文ID:1404.2540

分类:Genomics

分类简称:q-bio.GN

提交时间:2014-04-10

PDF 下载: 英文版 中文版pdf翻译中