基于机器学习的遗传变异分类
摘要:基于高质量的基因变异数据库,使用七种不同的分类算法训练和验证了一个新的数据集,用于将LOF变异分类为良性、致病和可能致病。在测试集上,使用XG-Boost算法获得了最佳的整体性能,F1-Score为0.88。在致病样本上有较高的召回率和适度的精确度,而在可能致病类别上性能较差,但精确度适度。总体而言,鼓舞人心的结果使得我们的最终模型成为进一步进行实际测试的有希望的候选者。
作者:Abhinav Jain, Greg Slabaugh, Deepti Gurdasani
论文ID:2112.05154
分类:Genomics
分类简称:q-bio.GN
提交时间:2021-12-13