一种用于快速 de novo 布局未校正长纳米孔读取的频谱算法

摘要:新的长读测序器承诺通过产生数十千碱基长的读段来改变测序和基因组组装。然而,它们高错误率显着复杂化了组装,并且需要昂贵的修正步骤来使用标准的组装引擎布局读段。 我们提出了一种原始且高效的谱算法来布局未经纠正的纳米孔读段,并将其无缝集成到一个直观的重叠/布局/共识(OLC)组装方案中。该方法被证明可以将来自几种细菌基因组的牛津纳米孔读段组装成质量良好的(与参考基因组的相似性约为99\%)基因组大小的contigs,同时从Saccharomyces cerevisiae参考菌株中得到更多的断裂组装。 可用性和实现:http://github.com/antrec/spectrassembler 联系人:[email protected]

作者:Antoine Recanati, Thomas Br"uls, Alexandre d'Aspremont

论文ID:1609.07293

分类:Genomics

分类简称:q-bio.GN

提交时间:2017-07-18

PDF 下载: 英文版 中文版pdf翻译中