R中引导方法的并行优化
摘要:在生物统计学中,自助法是一种常用且计算要求较高的重采样方法,用于测量样本估计的准确性和辅助统计推断。R是一种免费的语言和环境,被生物统计学家广泛使用于基因组数据分析。对这类R用户进行的调查突出了其自助法实现作为并行化的候选方案,以克服计算瓶颈问题。Simple Parallel R Interface (SPRINT)是一个允许R用户在多核桌面计算机和超级计算机上利用高性能计算的软件包,而无需对此类系统有专业知识。本文描述了将自助法并行化并纳入SPRINT R软件包的过程。根据自助法统计量的复杂性和重新采样的数量,该实现在超级计算机的16个节点上接近理想的加速度,并在512个节点上接近100。在多节点环境中,这一性能与R原生实现自助法的现有并行化选项相比具有优势。
作者:T. M. Sloan, M. Piotrowski, T. Forster, P. Ghazal
论文ID:1401.6389
分类:Computation
分类简称:stat.CO
提交时间:2014-01-27