大型交叉混合效应模型的抽屉随机梯度 Langevin 动力学

摘要:大型交叉混合效应模型具有不平衡结构和缺失数据,为标准贝叶斯后验采样算法带来了重大的计算挑战,因为计算复杂度通常是观测数量的超线性。我们提出了两种有效的基于子集的随机梯度MCMC算法,用于这样的交叉混合效应模型,可以方便地进行方差分量和回归系数的可扩展推断。第一种算法是针对无缺失观测的平衡设计开发的,我们利用完整数据矩阵的精度矩阵的闭式表达式。第二种算法,我们称之为鸽巢随机梯度朗格朗日动力学(PSGLD),适用于可能存在大比例缺失观测的平衡和不平衡设计。我们的PSGLD算法通过运行短的马尔可夫链来填补潜在的交叉随机效应,然后在每个MCMC迭代中对方差分量和回归系数的模型参数进行采样。通过展示所提出算法的输出分布收敛到目标非对数凹后验分布,我们提供了理论保证。基于合成数据和真实数据的各种数值实验表明,所提出的算法可以显著降低标准MCMC算法的计算成本,并更好地平衡近似精度和计算效率。

作者:Xinyu Zhang, Cheng Li

论文ID:2212.09126

分类:Computation

分类简称:stat.CO

提交时间:2022-12-20

PDF 下载: 英文版 中文版pdf翻译中