无参考情况下探索基因组特征和序列质量

摘要:大规模复杂基因组的de novo组装是当前可用的DNA测序技术面临的一项重大挑战。虽然有许多de novo组装软件包可供选择,但相对较少关注协助用户进行组装的软件。本文通过引入新的方法来进行DNA序列读取集合的质量评估,解决了de novo组装的实际问题。所述软件实现在没有参考基因组的情况下计算每个碱基的错误率、配对末端片段大小直方图和覆盖度指标。此外,该软件还将估计测序基因组的特征,如重复内容和杂合度,这些是组装难度的关键因素。所描述的软件是免费且开源的,遵循GNU Public License许可。

作者:Jared T. Simpson

论文ID:1307.8026

分类:Genomics

分类简称:q-bio.GN

提交时间:2013-07-31

PDF 下载: 英文版 中文版pdf翻译中