转录组范围关联研究框架下基因水平多基性的贝叶斯估计方法
摘要:基因多态性研究的目标是确定对复杂性状有非零影响的多个基因变异。这些变异的比例被定义为基因多态性。评估基因多态性可以为复杂性状的遗传架构提供有价值的见解。最近的几项研究试图在SNP水平上估计基因多态性。然而,在基因水平上评估基因多态性在生物学上更有意义。我们提出了“基因水平多态性”的概念,其在转录组关联研究框架下定义为对该性状有非零影响的基因比例。我们引入了一种贝叶斯方法polygene来估计该性状的基因水平多态性。该方法基于钉板先验,并同时提供一个最佳的非空基因子集。我们的模拟研究表明polygene能够有效估计基因水平的多态性。对于具有非空基因的小选择,该方法会产生向下偏差,但随着GWAS样本量的增加,这种偏差会迅速减小。在确定非空基因的最佳子集时,polygene具有很高的特异性和整体较好的敏感性,而敏感性随着参考面板表达和GWAS数据的样本量增加而增加。我们将该方法应用于英国生物库中的七个表型,整合表达数据。我们发现身高是最多态性的特征,而哮喘是最少多态性的特征。我们的分析表明,HDL和甘油三酯的多态性高于LDL。
作者:Arunabha Majumdar and Bogdan Pasaniuc
论文ID:2207.12173
分类:Genomics
分类简称:q-bio.GN
提交时间:2022-07-26