基于点云的深度学习策略用于蛋白质-配体结合亲和力预测

摘要:基于深度学习算法的蛋白质-配体亲和力模型的开发引起了广泛关注,主要是由于其在药物研发中的巨大应用。本文首次应用点云多层感知器PointNet和PointTransformer来预测蛋白质-配体亲和力。从PDBbind-2016数据集中,可以快速生成三维点云,其中包含3,772个点云和11,327个点云,分别来自精细集合和常规集合。这些点云用于训练PointNet或PointTransformer,根据CASF-2016基准测试,从较大的点云分别得出了具有Pearson相关系数R = 0.831或0.859的蛋白质-配体亲和力预测模型。参数分析表明,这两种深度学习模型能够学习蛋白质和其配体之间的许多相互作用,并且这些相互作用的关键原子可以在点云中可视化。通过PointTransformer学习到的蛋白质-配体相互作用特征可以进一步适应基于XGBoost的机器学习算法,结果得出了平均Rp为0.831的预测模型,与基于PDBbind数据库的最先进机器学习模型相媲美。这些结果表明,从PDBbind数据集衍生的点云可以用于评估以3D点云为中心的深度学习算法的性能,这些算法可以从自然进化或药物化学中学习到关键的蛋白质-配体相互作用,并在研究蛋白质-配体相互作用时具有广泛的应用。

作者:Yeji Wang, Shuo Wu, Yanwen Duan, Yong Huang

论文ID:2107.04340

分类:Biomolecules

分类简称:q-bio.BM

提交时间:2021-07-12

PDF 下载: 英文版 中文版pdf翻译中