解读BERT架构对MHC I类蛋白质肽段呈递的预测

摘要:MHC类I途径支持免疫系统对癌症和病毒的检测。它在细胞内部的蛋白质上呈现部分肽段(肽)于其细胞膜表面,使得能够检测非自身肽段的免疫细胞停止该细胞。预测肽段是否会被呈现在MHC类I分子上有助于设计疫苗,以激活免疫系统来摧毁入侵的疾病蛋白质。我们设计了一个预测模型,使用基于BERT的架构(ImmunoBERT),它以肽段及其周围区域(N和C端)以及一组MHC-I分子作为输入。我们还将这些结果与3D结构可视化和氨基酸频率结合使用,采用了众所周知的可解释性技术SHAP和LIME,并用于理解和确认对输出有影响的输入氨基酸序列的最有影响力的部分。特别是,我们发现靠近肽段N和C端的氨基酸非常重要。此外,MHC蛋白质中的某些位置(特别是A、B和F口袋)通常被赋予较高的重要性排名,这证实了生物学研究和结构可视化中的距离。

作者:Hans-Christof Gasser, Georges Bedran, Bo Ren, David Goodlett, Javier Alfaro, Ajitha Rajan

论文ID:2111.07137

分类:Quantitative Methods

分类简称:q-bio.QM

提交时间:2021-11-16

PDF 下载: 英文版 中文版pdf翻译中