PAR-CLIP 数据中发生替代的概率建模

摘要:照片可活化核苷酸增强交联和免疫沉淀(PAR-CLIP)是一种基于下一代测序的实验方法,用于鉴定给定蛋白质的RNA相互作用位点。该方法有意在RNA-蛋白质相互作用位点插入T到C的替代,与其他CLIP方法相比提供了第二层证据。然而,该实验包括多个噪声源,导致低频错误和虚假高频改变。因此,需要进行严格的统计分析,以区分交联后真实的T到C碱基变化和噪声。到目前为止,大多数现有的PAR-CLIP数据分析方法都专注于丢弃低频错误,并依赖于高频替代来报告结合位点,而不考虑高频假阳性替代的可能性。在这里,我们介绍了BMix,一种新的概率方法,明确考虑了PAR-CLIP数据中的噪声来源,并区分了交联引起的T到C替代和低频和高频的错误改变。我们在模拟和真实的公开可用的人类数据集上展示了我们方法相对于现有方法的出色速度和准确性。该模型已在Matlab工具箱BMix中实现,并在www.cbg.bsse.ethz.ch/software/BMix上免费提供。

作者:Monica Golumbeanu, Pejman Mohammadi, and Niko Beerenwinkel

论文ID:1504.01619

分类:Quantitative Methods

分类简称:q-bio.QM

提交时间:2015-04-08

PDF 下载: 英文版 中文版pdf翻译中