ReadsMap:一种用于高精度映射DNAseq和RNAseq读取序列的新工具。

摘要:将短序列(reads)映射到基因组的程序非常丰富。然而,包括Bowtie,BWA,TopHat和许多其他受欢迎且不断发展的程序在内,这些程序大多基于Burrows-Wheeler Transform(BWT)算法。这种方法在映射高同源性reads时非常有效,但在映射具有高错误率或SNP的reads时会遇到问题。此外,它在映射RNASeq剪接reads(例如与内含子序列相对应的间隙对齐的reads)时也存在问题,这对于找到内含子和可变剪接基因Isoform非常重要。与此同时,找到内含子位置是确定基因结构、特别是可变剪接变体的最重要任务。在本文中,我们提出了一种涉及哈希参考基因组的新算法。实现此算法的ReadsMap程序,能够将大量短读序列映射到一个或多个基因组contig中,通过更好地对由长内含子分隔的非常短的reads部分进行对齐,并计算映射其他包含相同内含子的reads之间插入的信息块。可用性和实施:ReadsMap采用C语言实现。它已集成到Fgenesh++基因识别流水线中,并在Softberry网站www.softberry.com上免费提供给学术用户使用。

作者:Igor Seledtsov (1), Jaroslav Efremov ( 1 and 2), Vladimir Molodtsov (1 and2), Victor Solovyev (1)

论文ID:1908.01445

分类:Genomics

分类简称:q-bio.GN

提交时间:2019-08-06

PDF 下载: 英文版 中文版pdf翻译中