动态读映射和在线一致性调用以改善变异检测
摘要:高通量测序数据的变异检测是鉴定复杂疾病和癌症相关等位基因的重要步骤。为了处理这些海量数据,使用了复杂的序列分析流程。这类流程的核心组件是读取映射模块,其准确性对结果的变异调用质量有很大影响。 我们提出了一种动态读取映射方法,显著提高了读取对齐的准确性。动态映射的一般思想是基于先前计算的读取对齐不断更新参考序列。尽管这个概念已经出现在文献中,但我们认为我们的工作提供了对这种方法的第一次全面分析。 为了评估动态映射的好处,我们开发了一个软件流程(http://github.com/karel-brinda/dymas),模拟不同的动态映射场景。该流程被应用于比较动态映射与传统的静态映射以及所谓的迭代参考(一种计算开销较大的过程,在此过程中计算参考的最佳修改,以最大化所有对齐的整体质量)。我们得出结论,在所有替代方案中,动态映射的准确性都远远优于静态映射,接近迭代参考的准确性。 为了在动态映射过程中纠正参考序列,我们开发了一个名为OCOCO的在线一致性调用器(http://github.com/karel-brinda/ococo)。OCOCO是第一个能够以在线方式处理输入读取的一致性调用器。 最后,我们对动态映射的可行性进行了结论,并讨论了实施该方法所必须克服的主要障碍。我们还回顾了动态映射的各种可能应用,并特别强调变异检测。
作者:Karel Bv{r}inda, Valentina Boeva, Gregory Kucherov
论文ID:1605.09070
分类:Genomics
分类简称:q-bio.GN
提交时间:2016-05-31