重叠基因的组合学
摘要:重叠基因存在于所有生命领域,比其在20世纪70年代首次发现时预期的要丰富得多。假设参考基因在正义链中以+0的方式阅读,重叠基因可以在两个阅读框中编码,分别表示为+1和+2;在反义链中有三个阅读框,分别表示为-0、-1和-2。这激发了许多研究人员对遗传密码对各种重叠框架造成的约束进行研究,主要基于信息论。本文的重点是关于两个重叠基因在氨基酸和多肽方面所引发的约束。我们表明,简单的线性约束将氨基酸组成与重叠基因所编码的两个蛋白质联系起来。当考虑了多肽而不仅仅是单个氨基酸时,会出现新的约束。例如,在具有重叠阅读框-2的双编码序列中,重叠框中的每个酪氨酸(表示为Tyr或Y)与参考框中的酪氨酸重叠(反之亦然),而特定的字词(例如YY)从不出现。因此,我们区分空约束(在框-2中YY = 0)和非空约束(框+0中的Y <=> 框-2中的Y)。我们的等价约束是对称的,因此可以描述重叠蛋白质的联合组成。我们描述了几个形式的框架和一个图算法来描述和计算这些约束。这些结果有助于理解重叠基因的机制和进化,并为开发新的重叠基因检测方法提供支持。
作者:Sophie Lebre and Olivier Gascuel
论文ID:1602.04971
分类:Genomics
分类简称:q-bio.GN
提交时间:2017-01-20