MUSIC:用于大规模短读序列数据的Burrows-Wheeler比对的混合计算环境

摘要:高通量DNA测序仪在我们理解分子水平上的疾病,农业中的标记辅助选择以及微生物遗传学研究中变得不可或缺。这些测序仪产生了大量的数据(通常每月原始数据量可达几十TB),需要高效的分析、管理和解释。目前常用的测序仪每次运行可以产生数十亿个短序列(最多150个碱基)。数据分析的第一步是将这些短序列与所选的参考基因组进行比对。有各种开源算法可用于序列与参考基因组的比对。这些工具通常对计算开销较大,无论是处理器数量还是内存。在这里,我们提出了一种名为MUSIC(Mapping USIng hybrid Computing)的混合计算环境,用于最流行的开源序列比对算法BWA,利用加速器比串行代码显示出更快的速度改进。

作者:Saurabh Gupta, Sanjoy Chaudhury 'and' Binay Panda

论文ID:1402.0632

分类:Genomics

分类简称:q-bio.GN

提交时间:2014-02-05

PDF 下载: 英文版 中文版pdf翻译中