鲁棒且并行的贝叶斯模型选择
摘要:高效准确的模型选择是现代数据分析中的一个重要问题。其中一个主要挑战是处理无法在一台机器上存储或处理的大型数据集所需的计算负担。另一个可能遇到的挑战是存在损害推断质量的异常值和污染。并行的“分治”模型选择策略将完整数据集的观测值分成大致相等的子集,并在每个子集上独立进行推断和模型选择。在局部子集推断之后,该方法使用几何中值的概念将后验模型概率或其他模型/变量选择标准进行聚合,从而获得最终模型。这种方法能够在寻找“正确”模型和模型参数方面获得更好的集中效果,而且对异常值和数据污染也具有可证明的鲁棒性。
作者:Michael Minyi Zhang, Henry Lam, Lizhen Lin
论文ID:1610.06194
分类:Machine Learning
分类简称:stat.ML
提交时间:2018-06-26