癌症识别的甲基化数据的Parenclitic网络分析

摘要:使用复杂网络理论的思想来实现对携带癌症发展标志的人类DNA甲基化数据的机器学习分类。这些数据是从患有多种癌症的患者中获得的,并表示为拟包含网络,其中节点对应基因,边的权重根据与对照组受试者的成对变化而定。我们证明,在研究的10种癌症类型中,基于网络度量可以在癌症阳性和阴性样本之间进行高性能的二元分类。值得注意的是,仅使用12个网络拓扑指标就可以实现高达93-99%的准确率,从原始的15295个基因甲基化水平大大降低了复杂性。此外,研究发现,在癌症阴性受试者中,拟包含网络呈现无标度特性,并且在癌症中偏离了幂律节点度分布。节点中心性排名和出现的模块化结构可以为癌症的系统生物学提供洞察力。

作者:Alexander Karsakov, Thomas Bartlett, Iosif Meyerov, Alexey Zaikin, Mikhail Ivanchenko

论文ID:1506.04421

分类:Genomics

分类简称:q-bio.GN

提交时间:2017-02-22

PDF 下载: 英文版 中文版pdf翻译中