GenHap:一种基于遗传算法的新型计算方法用于单倍体组装
摘要:基于遗传算法的新型计算方法GenHap用于单细胞测序数据的全基因组组装,通过全局搜索过程获得最优解。通过对Roche/454和PacBio RS II测序技术的两个合成数据集的运行比较,发现GenHap始终获得高准确性的解(以单倍型错误率为指标),在Roche/454实例中比HapCol快4倍,在PacBio RS II数据集上比HapCol快20倍。最后,我们还对GenHap在两个不同的真实数据集上的性能进行了评估。与现有的单倍型相位算法相比,未来生成的测序技术在长读长、高覆盖度方面具有巨大的潜力,可以从GenHap的高效解决大规模基因型组装问题的能力中受益。
作者:Andrea Tangherloni, Simone Spolaor, Leonardo Rundo, Marco S. Nobile, Paolo Cazzaniga, Giancarlo Mauri, Pietro Li`o, Ivan Merelli, Daniela Besozzi
论文ID:1812.07689
分类:Genomics
分类简称:q-bio.GN
提交时间:2018-12-20