使用不完整的脊椎动物参考转录组时的RNA-Seq映射错误
摘要:全转录组测序越来越多地被用作功能基因组学研究非模型生物的工具。然而,当用于计算差异表达的参考转录组不完整时,推断的表达水平可能存在显著误差。在本研究中,我们利用从真实转录组生成的模拟reads来确定比对的准确性,并测量使用不完整转录组引起的误差。我们展示了有两个主要的计数误差来源:1)共享reads的可变剪接变体,2)来自参考转录组的缺失转录本。可变剪接变体增加了比对的假阳性率,而不完整的参考转录组则降低了真阳性率,导致转录本表达水平的不准确。按基因或reads分享组织转录本(类似于基因组参考比对)显著降低了假阳性,但只有改进参考转录组本身才能解决缺失转录本的问题。我们还证明,采用不同的比对软件在模拟数据上并没有明显提高准确性。最后,我们展示了读长或插入大小必须增加到1kb以上才能解决比对的模糊性。
作者:Alexis Black Pyrkosz and Hans Cheng and C. Titus Brown
论文ID:1303.2411
分类:Genomics
分类简称:q-bio.GN
提交时间:2013-03-12