Segmentor3IsBack:用于快速和准确分割Seq数据的R软件包
摘要:基因注释是生物学中一个重要的问题,长期以来一直通过基因预测方法和需要生物专业知识的手动实验来解决。扩展的下一代测序技术及其提高的精确性为该领域提供了一种新的方法:利用RNA-Seq数据的分割来确定基因边界。由于具有几乎线性复杂度,我们建议使用剪枝动态规划算法(PDP算法),该算法在CGH阵列方面的性能已得到认可,用于Seq实验输出。这需要将算法适应与我们对数据建模的负二项分布。我们证明,如果信号的离散度已知,则可以使用PDP算法,并为该离散度提供一个估计值。然后,我们建议使用奥拉克惩罚来估计可以与基因组编码或非编码区域相关联的片段数量。我们在真实数据集上展示了我们方法的结果,并展示了其良好性能。我们的算法可作为R包在CRAN存储库中获得。
作者:Alice Cleynen, Michel Koskas, Emilie Lebarbier, Guillem Rigaill, Stephane Robin
论文ID:1204.5564
分类:Computation
分类简称:stat.CO
提交时间:2013-07-02