二进制区间搜索(BITS):一种可扩展的用于计数区间交集的算法
摘要:比较不同的基因组数据集是理解基因组生物学的基础。研究人员必须探索许多大型基因组区间的数据集(例如基因、序列比对),以将他们的实验结果置于更广泛的背景中并进行新的发现。基因组数据集之间的关系通常通过识别相交的区间来衡量:也就是说,它们重叠并共享一个共同的基因组区间。鉴于DNA测序技术的不断进步,对于测量许多基因组特征集之间的统计显著关系的高效方法对于未来的发现至关重要。 我们介绍了一种新颖且可扩展的区间集相交算法Binary Interval Search(BITS)。我们证明了BITS在计算区间相交数量方面优于现有方法。此外,我们展示了BITS适用于并行计算架构(如图形处理单元GPU),并演示了其在高效进行蒙特卡洛模拟,以测量基因组区间集之间关系显著性方面的实用性。
作者:Ryan M. Layer, Kevin Skadron, Gabriel Robins, Ira M. Hall, and Aaron R. Quinlan
论文ID:1208.3407
分类:Genomics
分类简称:q-bio.GN
提交时间:2012-08-20