家族全基因组关联研究数据中多个重要单核苷酸多态性的同时选择
摘要:通过一种基于重采样的快速变量选择技术,我们提出了一种在多标记混合效应模型中检测相关单核苷酸多态性(SNP)的方法。由于计算复杂性,目前的实践主要是单独检测一个SNP的效应,通常被称为“单个SNP关联分析”。在基因或途径中联合建模可能具有更好的检测相关基因变异的能力,特别是那些效应较弱的基因变异。在本文中,我们提出了一种基于e值框架的计算效率高的模型选择方法,用于在家族中单个SNP的检测,同时利用多个SNP的信息。为了克服传统模型选择方法的计算瓶颈,我们的方法仅训练一个单一模型,并利用一种快速和可扩展的bootstrap过程。通过数值研究,我们证明了我们提出的方法比使用家族数据的单标记分析或忽略家族依赖结构的模型选择方法更有效地检测与特征相关的SNP。此外,我们利用我们的方法在明尼苏达双胞胎和家族研究中心(MCTFR)数据集上进行基因水平分析,检测到一些与饮酒有关的SNP。
作者:Subhabrata Majumdar, Saonli Basu, Matt McGue and Snigdhansu Chatterjee
论文ID:1802.01141
分类:Applications
分类简称:stat.AP
提交时间:2023-05-23