图谱鉴定断层图像中的蛋白质 (GRIP-Tomo)
摘要:基于网络理论的模式挖掘方法可以在不知道预定义模板或人为修正偏见的情况下,从合成的体积密度中识别蛋白质结构或复合物。我们假设蛋白质结构的拓扑连接是不变的,并且它们在体积密度中的表现具有鲜明的特点,可用于蛋白质识别的目的。通过将蛋白质或复合物的三维密度从模拟的层析体积转换为数学图形作为可观测量。我们系统地引入数据失真或缺陷,例如数据缺失、翻滚效应和缺失角度效应等,进入模拟的体积,并根据像素之间的距离截断值,捕获在缺陷存在的情况下密度聚类中心之间的可变连接。通过比较包括节点度、介数中心性和图形密度在内的网络理论顺序参数,计算模拟体积图形与从物理蛋白质结构中转换的图形之间的相似度分数。通过捕捉定义网络异质形态的基本拓扑特征,我们能够在没有添加逼真噪声的情况下,准确识别出十个具有拓扑特征的样本中的蛋白质和同型多聚复合物。我们的方法为未来层析图处理的发展提供了可解释性的模式挖掘,可以实现对单域蛋白质的本地拓扑以及嘈杂体积中独特单域蛋白质与多聚复合物的分类。
作者:August George, Doo Nam Kim, Trevor Moser, Ian T. Gildea, James E. Evans, Margaret S. Cheung
论文ID:2210.08194
分类:Quantitative Methods
分类简称:q-bio.QM
提交时间:2022-10-18