氨基酸频率和基因组GC含量演化的语言机制
摘要:蛋白质的氨基酸组成和DNA的碱基组成中存储了大量的信息。我们通过一个语言模型模拟了氨基酸频率和基因组GC含量的演化。结果显示,遗传密码的演化决定了氨基酸频率和基因组GC含量的演化。我们在一个统一的理论框架中解释了氨基酸频率、基因组GC含量和蛋白质长度分布之间的关系。尤其是,氨基酸频率和密码子位置GC含量的演化模拟与目前已知的所有基因组数据的结果非常吻合。此外,我们发现蛋白质组中平均蛋白质长度的范围和氨基酸频率的比值对于描述系统发育和演化非常有用。令人惊讶的是,这个空间中所有物种的点形成了一个演化流动。我们相信氨基酸的获得和丧失受到氨基酸频率变化的既定模式的驱动。这种语言机制有助于揭示遗传密码的起源。
作者:Dirson Jian Li
论文ID:q-bio/0612010
分类:Genomics
分类简称:q-bio.GN
提交时间:2007-05-23