Minimap和miniasm:用于嘈杂长序列的快速映射和全新组装

摘要:长读取错误率高达10-15%,需要复杂且计算密集的数据处理流程。本文介绍了一种高效的映射器minimap和一种新的de novo装配器miniasm,可以在没有错误校正阶段的情况下进行SMRT和ONT读取的映射和装配。它们通常可以在几分钟内将细菌数据的测序运行装配为单一contig,并以9分钟的速度对45倍C. elegans数据进行装配,比现有流程快几个数量级。此外,还介绍了一种成对读取映射格式(PAF)和图形化片段装配格式(GFA),并展示了与现有工具之间的互操作性。

作者:Heng Li

论文ID:1512.01801

分类:Genomics

分类简称:q-bio.GN

提交时间:2017-08-07

PDF 下载: 英文版 中文版pdf翻译中