蛋白质家族中氨基酸模式的自然结构
摘要:蛋白质家族的自然结构通过有限序列群中元素的重复形成的模式来描述。我们提出了一种方法,使用数学上严格定义的“重复”、高效算法实现和无可调整参数的健壮评分系统,在蛋白质序列中搜索模式和模式的分组。我们表明,根据其在嵌套结构中的重复出现,序列模式可以很好地分离为不相交的类别。模式出现的统计数据表明,短重复就可以用超过10个标准偏差来解释自然家族与随机群体之间的差异,而长度小于5个残基的模式则有效随机。一小部分模式就足以解释任意序列集合的健壮“熟悉度”定义。
作者:Pablo Turjanski and Diego U. Ferreiro
论文ID:1807.10394
分类:Biomolecules
分类简称:q-bio.BM
提交时间:2018-07-30