JS-MA: 一种基于Jensen-Shannon散度的方法,用于在多种疾病上进行全基因组关联分析

摘要:使用高通量基因分型技术的单核苷酸多态性(SNP),大规模全基因组关联研究(GWASs)被认为是揭示基因型与表型之间复杂关系的方法,尤其是常见疾病。然而,目前的多位点方法在计算成本和鉴定力方面仍然不足,无法检测到统计显著的相互作用,也缺乏发现多样化的遗传效应对多种疾病的能力。特别是,对高阶相互作用($geq$ 2 SNP)进行多个统计检验将产生巨大的分析挑战,因为计算成本随着相互作用模块中SNP的基数的增长而呈指数增加。本文提出了一种简单、快速、强大的方法,命名为JS-MA,使用Jensen-Shannon散度和高维k均值聚类算法,将全基因组的多位点相互作用映射到多种疾病上。通过对系统模拟实验结果的比较,我们的方法与一些最先进的关联分析工具相比,具有更强的能力和效率。我们还将JS-MA应用于WTCCC的GWAS数据集中的两种常见疾病,即类风湿性关节炎和1型糖尿病。JS-MA不仅确认了一些最近报道的具有生物学意义的相关性,还发现了一些新颖的结果。因此,我们认为我们的方法适用于在大规模GWASs中进行多疾病相关互作用的全面分析。

作者:Xuan Guo

论文ID:1811.07099

分类:Genomics

分类简称:q-bio.GN

提交时间:2018-11-20

PDF 下载: 英文版 中文版pdf翻译中