eQTLs的二分社区结构
摘要:用于基因组范围关联研究(GWAS)和表达量基因型相关分析(eQTL)的方法已经产生了大量与各种人类表型相关的遗传关联。截至2013年,据NHGRI GWAS目录报告,已经有超过11,000个SNP与某种特征相关联。然而,解释这些SNP所发挥的功能角色仍然是一个挑战。在这里,我们描述了一种使用eQTL网络的固有双分图结构来将SNP置于功能上下文中的方法。 在对慢性阻塞性肺疾病(COPD)进行的一个研究中,我们使用163个肺组织样本的基因型和基因表达数据,计算了SNP与基因之间的eQTL关联,并将显著关联(FDR < 0.1)作为双分图中的链接。令人惊讶的是,我们发现网络中高连接的“中心”SNP缺乏与疾病相关的关联。然而,在该网络中,我们确定了35个高度模块化的社区,其中包括与一组基因相关的SNP;其中有13个社区在独特的生物学功能上显著富集(P < 5 x 10^{-4}),其中包括与COPD相关的功能。此外,我们发现GWAS显著的SNP富集在这些社区的核心位置,包括先前鉴定的COPD、哮喘和肺功能等的GWAS关联。这些结果符合我们的直觉:与其说是单个SNP影响单个基因,我们更倾向于认为是一组与功能相关的基因表达相关的SNP,而疾病相关的SNP则与这些功能的紊乱相关。这些方法不限于COPD的应用,可以用于对各种疾病过程和其他表型特征的分析。
作者:John Platig, Peter Castaldi, Dawn DeMeo, and John Quackenbush
论文ID:1509.02816
分类:Genomics
分类简称:q-bio.GN
提交时间:2016-09-28