蛋白质数据库中的蛋白质家族分类通过熵度量

摘要:通过随机变量的函数和氨基酸出现的概率的熵度量,本文回顾了近几年来在蛋白质数据库中分类氨基酸分布到家族和族群的基本方法。本文重点研究了Pfam数据库,限制在可以用m行(蛋白质结构域)和n列(氨基酸)的矩形数组表示的家族。本研究还鼓励世界各地的科研团队对不同行列数量进行统计分析,因为我们相信通过数学特征化氨基酸的分布对于蛋白质结构和进化的确定具有基本见解。

作者:R.P. Mondaini, S.C. de Albuquerque Neto

论文ID:1806.05172

分类:Biomolecules

分类简称:q-bio.BM

提交时间:2018-06-15

PDF 下载: 英文版 中文版pdf翻译中