利用亲和网络融合(ANF)集成多组学数据进行癌症患者聚类

摘要:癌症患者的聚类和癌症亚型的识别是癌症基因组学中的重要任务。基于全面的多组学分子特征聚类往往比单一数据类型的聚类效果更好,因为每个组学数据类型(代表患者的一个视角)可能包含互补信息。然而,将异质组学数据类型直接整合是具有挑战性的。本文中,我们提出了Affinity Network Fusion(ANF),这是Similarity Network Fusion(SNF)的“升级版”,具有几个优点。类似于SNF,ANF将每个组学数据类型视为患者的一个视角,并学习用于聚类的融合亲和力(转移)矩阵。我们将ANF应用于一个经过精心处理的通过GDC数据门户下载的癌症数据集,该数据集包含2193名患者,并在将患者正确聚类为疾病类型方面取得了令人期待的结果。我们的实验结果还表明,在患者聚类中结合使用特征选择和转换的ANF的能力。此外,特征值间隙分析表明,使用我们提出的框架学习的四种癌症类型的亲和力矩阵可能成功捕获了患者群组结构,并可用于发现未知的癌症亚型。

作者:Tianle Ma and Aidong Zhang

论文ID:1708.07136

分类:Genomics

分类简称:q-bio.GN

提交时间:2017-08-25

PDF 下载: 英文版 中文版pdf翻译中