QuorUM: 一种用于Illumina读取校正的错误修正器
摘要:使用Illumina测序数据可以以较低成本产生高覆盖度的基因组,基因序列长度在100 bp至150 bp之间。我们的目标是产生经过修整和纠错的读取数据以提高基因组装过程。我们的纠错程序旨在产生经过纠错的读取数据集,以(1)最小化集合中不存在于基因组中的虚假k-mer数量,并且(2)最大化在基因组中存在的真实k-mer数量。由于Illumina读取数据在基因组上的覆盖度差异很大,因此我们不能简单地排除出现频率较低的k-mer。 结果:我们的软件QuorUM提供了相对准确的纠错,并适用于大型数据集(每天每个核心处理和纠正10亿个碱基)。 可用性:QuorUM分发为独立的软件包,并作为MaSuRCA组装软件的一个模块。两者均在GPL开源许可下提供,可在http://www.genome.umd.edu下载和使用。 联系人:[email protected]
作者:Guillaume Marc{c}ais and James A. Yorke and Aleksey Zimin
论文ID:1307.3515
分类:Genomics
分类简称:q-bio.GN
提交时间:2013-07-15