高通量测序数据纠错方法的综合评估

摘要:DNA和RNA测序的出现革命性地改变了基因组学和分子生物学的研究。Illumina、Ion Torrent、SOLiD测序等下一代测序(Next Generation Sequencing,NGS)技术为基因组测序提供了一种快速、廉价的方法。最近,第三代测序(Third Generation Sequencing,TGS)技术,如PacBio和Oxford Nanopore Technology(ONT),也得到了发展。不同的技术使用不同的测序方法,并且容易产生不同的错误率。虽然存在许多用于纠正NGS和TGS方法的测序数据的错误的工具,但尚无标准方法来评估这些错误修正工具的准确性和有效性。在本研究中,我们提出了一种用于评估DNA和RNA测序中错误修正的软件包(SPECTACLE),为NGS和TGS平台提供了全面的算法。我们还提供了用于Illumina、PacBio和ONT平台的测序数据集,这些数据集为错误修正工具提供了具有挑战性的情景。使用这些数据集和SPECTACLE,我们评估了23种不同的错误修正工具的性能,并提供了有关它们的优点和缺点的独特和有用的见解。我们希望我们的方法能够在未来标准化DNA和RNA错误修正工具的评估。

作者:Yun Heo, Gowthami Manikandan, Anand Ramachandran, Deming Chen

论文ID:2007.05121

分类:Genomics

分类简称:q-bio.GN

提交时间:2021-03-26

PDF 下载: 英文版 中文版pdf翻译中