序列捕获与限制位点相关DNA测序在系统地理学中的比较
摘要:使用大规模并行测序方法产生的基因组数据集有潜力推动系统分类学向新的和令人兴奋的方向发展,但选择合适的标记物和方法并不简单。我们将两种在系统分类学中具有特殊前景的方法应用于一组来自非模式的新热带鸟类的样本。我们发现,无论是RAD-Seq还是Seq-cap都能产生包含数千个位点和SNPs的基因组数据集,推断得出的种群分配和物种树在数据集之间是一致的。然而,基于模型的人口参数估计在数据集之间存在差异,特别是当我们使用基于等位基因频谱的方法来估计参数时。我们观察到的差异可能是由于不同方法之间的序列数据的组装、比对和过滤方面存在差异,我们的研究结果表明,在使用低覆盖度测序数据估计参数时需要谨慎使用等位基因频率。我们进一步使用模拟的Seq-cap和RAD-Seq样本数据集探讨了方法之间的差异。对模拟数据的分析表明,将位点数从500个增加到5000个可以提高系统发育一致性因子、人口参数估计的准确性和精度,但将位点数增加到5000个以上只会带来微小的收益。将位点长度从64 bp增加到500 bp可以提高系统发育一致性因子,并且超过500 bp的位点长度只会带来微小的收益,但位点长度不影响人口参数估计的准确性和精度。我们根据可用的数据收集方法的多样性讨论了我们的结果,并提供了在系统分类学研究中利用下一代测序的建议。
作者:Michael G. Harvey, Brian Tilston Smith, Travis C. Glenn, Brant C. Faircloth, and Robb T. Brumfield
论文ID:1312.6439
分类:Genomics
分类简称:q-bio.GN
提交时间:2017-03-28