组装大型、复杂的环境宏基因组
摘要:将大规模的测序数据应用于复杂环境的深度采样,给序列分析方法带来了新的挑战。新组装技术在有效减少需要分析的数据总量方面很有用,但需要大量的计算资源。我们应用两种组装前的过滤方法,数字标准化和分区,来使大规模的宏基因组组装更易于计算。使用人类肠道模拟群落数据集,我们证明这些方法得到的组装结果几乎与未经处理的数据得到的组装结果相同。然后,我们从相匹配的爱草和本土草原土壤中组装了两个大型土壤宏基因组。组装出的contigs的预测功能内容和系统发育来源表明,尽管功能相似,但在分类方面存在显著的差异。所提出的组装策略是通用的,并可以扩展到任何宏基因组;全部源代码可在BSD许可下免费使用。
作者:Adina Chuang Howe, Janet Jansson, Stephanie A. Malfatti, Susannah G. Tringe, James M. Tiedje, C. Titus Brown
论文ID:1212.2832
分类:Genomics
分类简称:q-bio.GN
提交时间:2013-01-01