基因组组装的知情和自动k-mer大小选择
摘要:基于de Bruijn图框架的基因组组装工具依赖于参数k,该参数代表了难以量化的几个竞争效果之间的平衡。目前缺乏能够自动估计最佳k值和/或快速生成k-mer丰度直方图的工具,从而使用户能够做出明智的决策。 我们开发了一种快速准确的采样方法,它比传统方法有数量级的性能提升,构建了近似的丰度直方图。然后,我们提出了一种快速启发式方法,该方法使用生成的丰度直方图来估计最佳的k值。我们使用多样的测序数据集测试了我们的工具的有效性,并发现其选择的k值导致了一些最佳的组装结果。 我们的工具KmerGenie免费提供,网址为:http://kmergenie.bx.psu.edu/
作者:Rayan Chikhi and Paul Medvedev
论文ID:1304.5665
分类:Genomics
分类简称:q-bio.GN
提交时间:2013-04-23