PRED-CLASS: 级联神经网络用于广义蛋白质分类和全基因组应用
摘要:蛋白质分类的层次递进的人工神经网络级联系统(PRED-CLASS)用于根据其氨基酸序列中的信息将蛋白质广义地分为四个不同类别:跨膜、纤维、球形和混合。个体组分网络的结构非常简单,减少自由参数(网络突触权重)的数量,以加快训练速度,提高泛化性能,并避免数据过拟合。凭借从仅包括50个蛋白质序列中获得的信息,这些序列分布在四个目标类别中(6个跨膜、10个纤维、13个球形和17个混合),PRED-CLASS能够在被明确归类为目标类别之一的387个蛋白质集合中获得371个正确预测(成功率约为96%)。将PRED-CLASS应用于几个测试集和几个生物体的完整蛋白质组,展示了这种方法在注释基因组开放阅读框,没有功能分配的初步步骤中,或者在折叠识别和从头结构预测方法中作为有价值的工具可以使用。可以通过World Wide Web访问详细结果以及运行PRED-CLASS算法的Web服务器,网址为http://o2.biol.uoa.gr/PRED-CLASS。
作者:Claude Pasquier, Vasilis Promponas, Stavros Hamodrakas
论文ID:0902.3146
分类:Quantitative Methods
分类简称:q-bio.QM
提交时间:2009-02-19