人类18个性状的功能基因组数据与全基因组关联研究的联合分析
摘要:基因结构和调控元素的注释可以为全基因组关联研究(GWAS)提供信息。然而,在解释给定特征的关联研究时选择相关注释仍然具有挑战性。我们描述了一种统计模型,该模型利用在全基因组计算的关联统计量,识别在影响特征的位点上富集或贫乏的基因组元素类别。该模型自然地融合了多种类型的注释。我们将该模型应用于包括红细胞特征、血小板特征、葡萄糖水平、脂质水平、身高、BMI和克罗恩病在内的18个人类特征的GWAS。对于每个特征,我们评估了450种不同的基因组注释的相关性,包括编码蛋白质的基因、增强子和超过一百种组织和细胞系中的DNase-I敏感位点。我们展示了影响蛋白质序列的表型相关SNP的比例从约2\%(血小板体积)到约20\%(低密度脂蛋白胆固醇)不等;被抑制的染色质在与多种特征相关的SNP中显著贫乏;细胞类型特异性的DNase-I敏感位点在与多种特征相关的SNP中富集(例如,与血小板体积相关的脾脏)。最后,通过使用来自功能基因组学的信息重新加权每个GWAS,我们将高置信度关联位点的数量提高了约5\%。
作者:Joseph K. Pickrell
论文ID:1311.4843
分类:Genomics
分类简称:q-bio.GN
提交时间:2014-04-24