通过关键随机网络从氨基酸序列预测原生蛋白质结构的二级结构、接触数和残基间的接触顺序
摘要:蛋白质结构的一维预测对于三维结构预测和序列-结构关系的理解非常重要。本研究介绍了一种新的机器学习方法,即临界随机网络(CRNs),用于预测一维结构,并结合位置特异性评分矩阵对二级结构(SS)、接触数(CN)和残基间接触顺序(RWCO)进行预测。该方法在SS预测上平均达到77.8%的$ Q_3 $精度,在CN和RWCO方面的相关系数分别为0.726和0.601。SS预测的准确性与其他最先进的方法相当,而CN预测的准确性则显著超过了之前的方法。我们提供了临界随机网络预测方案的详细表述,并检查了预测准确性的上下文依赖性。为了研究非线性和多体效应,我们将基于CRNs的方法与基于位置特异性评分矩阵的纯线性方法进行了比较。尽管不如基于CRNs的方法优越,但线性方法所达到的惊人准确性凸显了从氨基酸序列中提取高级结构特征的困难,除了由位置特异性评分矩阵提供的信息。
作者:Akira R. Kinjo, Ken Nishikawa
论文ID:q-bio/0503032
分类:Biomolecules
分类简称:q-bio.BM
提交时间:2007-05-23