通过适应补充数据改进人群特异性等位基因频率估计:一种经验贝叶斯方法
摘要:基因标记位点的等位基因频率估计是生物和生物医学研究的重要组成部分,如人类遗传变异研究或遗传特征遗传病因研究。随着遗传数据越来越多,研究人员面临一个困境:何时应将其他研究和人群亚组数据与主要数据进行合并?合并附加样本通常会减小频率估计的方差;但是,如果不正确使用合并估计,由于存在人群分层而可能严重偏倚。鉴于这种潜在偏倚,大多数研究人员即使针对具有相同族裔背景且生活在同一大陆的样本也会避免合并。在这里,我们提出了一种用于估计单核苷酸多态性等位基因频率的经验贝叶斯方法。该过程自适应地合并相关样本的基因型,使得更相似的样本对估计结果具有更大的影响。在我们考虑的每个示例中,我们的估计器的均方误差(MSE)都小于合并和不合并的情况,而且有时比两者都有明显改进。引入的偏差很小,这通过与实际数据示例仔细匹配的模拟研究得到证明。我们的方法在少数个体在大量标记位点上进行基因分型的情况下特别有用,这是我们在全基因组关联研究中可能会遇到的情况。
作者:Marc Coram, Hua Tang
论文ID:0712.1943
分类:Applications
分类简称:stat.AP
提交时间:2007-12-18