编码单核苷酸多态性之间的双向上位互作用的新方法
摘要:计算遗传风险评分时,建模基因-基因互作相互作用并不是遗传学的一个深入研究领域,但其有潜力在实践中改进风险分层。虽然机器学习(ML)的应用显示出改善目前遗传风险评估的希望,但其经常面临特征过多而数据过少的问题。我们提出了一种方法,当与ML结合使用时,可以保留个体遗传贡献者的信息,同时将其互作信息融入到一个特征中。这样一来,可以进行二阶分析,同时尽可能少地增加ML模型的输入特征数量。我们提出了三种考虑遗传互作的方法。我们发现,保留构成SNP信息的互作方法比最简单的互作方法表现更好。鉴于当前可用的ML方法能够考虑复杂的互作关系,仅利用原始SNP基因型就足够了,因为最简单的模型超过了所有的互作方法。考虑到理解和考虑遗传互作关系是增加可解释遗传性疾病变异性的最有前途的途径之一,这项工作代表了向保留每个组成部分信息的算法互作方法迈出的第一步。这不仅因为模型质量的潜在改进,还因为明确的互作项可以对疾病内潜在的互作途径进行人类可读的解释。
作者:Nathaniel Gunter and Prashanthi Vemuri and Vijay Ramanan and Robel K Gebre
论文ID:2306.09175
分类:Genomics
分类简称:q-bio.GN
提交时间:2023-06-16