六肽中的简洁淀粉样和非淀粉样模式
摘要:使用六肽作为模型系统广泛应用于研究多肽,包括蛋白质的淀粉样形成性质。最近,大量的实验数据库已经公开,包含淀粉样成分的标签。利用这些数据集进行训练和测试,可以构建基于人工智能的分类器,用于预测肽的淀粉状态。在我们之前的工作中(Biomolecules, 11(4) 500, (2021)),我们描述了基于支持向量机(SVM)的布达佩斯淀粉预测器(url{https://pitgroup.org/bap})。在这里,我们应用布达佩斯淀粉预测器发现了许多具有80%到84%准确度的淀粉样和非淀粉样六肽模式,这些模式是令人惊讶和简洁的新规则,用于进一步理解肽的淀粉状态。例如,我们发现对于任何独立突变的残基(以``x''标记的位置),模式CxFLWx、FxFLFx或xxIVIV被预测为淀粉样,而PxDxxx、xxKxEx和xxPQxx则被预测为非淀粉样。我们指出,每个具有两个``x''的淀粉样模式(例如,CxFLWx)简洁地描述了$20^2=400$个六肽,而包含四个点突变的非淀粉样模式(例如,PxDxxx)总共包含$20^4=160,000$个六肽。据我们所知,在本工作之前没有类似的人工智能工具应用或简洁的淀粉样模式的描述。
作者:Laszlo Keresztes and Evelin Szogi and Balint Varga and Viktor Farkas and Andras Perczel and Vince Grolmusz
论文ID:2202.14031
分类:Biomolecules
分类简称:q-bio.BM
提交时间:2022-03-01