排名列表中的相互丰富性和位置加权矩阵模体的统计评估

摘要:排名列表中的统计数据在分析分子生物学测量数据(如ChIP-seq)中非常重要,该数据生成了基因组序列的排名列表。最先进的方法研究了排名列表中的固定模式。在这种情况下,未解决更灵活的模型,如位置权重矩阵(PWM)模式。为了评估排名列表中PWM模式的富集性,我们使用PWM在同一元素集合上引发的第二个排名。通过排列来模拟一个排名列表相对于另一个的可能顺序。由于样本空间复杂性,很难表征排列组中的尾部分布。在本文中,我们对两个均匀且独立绘制的排列的顶部交集的大小的尾部分布提供了紧密的上界,并通过我们的软件实现(mmHG-Finder)展示了这种方法的优点,用于研究几个数据集中的PWMs。

作者:Limor Leibovich and Zohar Yakhini

论文ID:1307.7847

分类:Quantitative Methods

分类简称:q-bio.QM

提交时间:2013-07-31

PDF 下载: 英文版 中文版pdf翻译中