Taxator-tk:通过近似演化邻域对宏基因组进行快速且精确的分类归属
摘要:Metagenomics解析了直接从感兴趣环境中分离得到的DNA的随机shotgun测序,从而表征了微生物群落。计算分析的关键步骤是进行分类序列分配,这样我们可以识别测序的群落成员并重建具有个体分类数据的分类学bin。我们描述了一种算法和伴随的软件taxator-tk,通过快速近似确定来自序列相似性的进化邻居进行分类序列分配。对于各个级别和分类,taxator-tk在各个进化距离和短序列方面的分类学分配都是精确的。除了对metagenome进行分类binning外,它非常适合从metagenome样本中进行微生物群落的概况分析,因为它能够识别细菌、古菌和真核生物的群落成员,且不受标记基因扩增中引物结合强度的影响,也不受不同分类阶元间标记基因拷贝数变化的影响。taxator-tk具有高效、并行化实现,可以在标准多处理器系统(具有十个CPU核心)上每天分配6Gb的序列数据,并将微生物RefSeq作为基因组参考数据。
作者:J. Dr"oge, I. Gregor and A. C. McHardy
论文ID:1404.1029
分类:Genomics
分类简称:q-bio.GN
提交时间:2014-04-04