并行贝叶斯加法回归树

摘要:基于贝叶斯加法回归树(BART)的贝叶斯非线性回归方法已经被证明与基于装袋和提升等最先进的预测方法相媲美。BART具有一些优势。例如,随机搜索马尔科夫链蒙特卡洛(MCMC)算法可以更全面地搜索模型空间,并且MCMC样本之间的变化可以以通常的贝叶斯方式捕捉不确定性水平。BART先验是鲁棒的,通常可以使用默认先验获得合理的结果。然而,R软件包BayesTree中提供的BART算法的公开实现不够快以支持超过一千个观测值的交互式使用,甚至无法处理5万到10万个观测值。在本文中,我们展示了如何修改BART算法,并使用基于消息传递接口(MPI)库实现的单程序多数据(SPMD)并行计算进行计算。该方法几乎线性地扩展了处理器核心数量,使从业者能够对大规模数据集进行统计推断。我们的方法还可以处理单个数据存储库无法容纳的大规模数据集。

作者:Matthew T. Pratola and Hugh A. Chipman and James R. Gattiker and David M. Higdon and Robert McCulloch and William N. Rust

论文ID:1309.1906

分类:Computation

分类简称:stat.CO

提交时间:2013-09-10

PDF 下载: 英文版 中文版pdf翻译中