基于大规模真实世界数据的电子健康记录潜在类别变分贝叶斯表征方法

摘要:贝叶斯方法在临床分析中用于患者表型研究受到了计算挑战的限制,这是由于将马尔可夫链蒙特卡洛(MCMC)方法应用于大规模实际数据所带来的。通过优化变分证据下限来实现近似贝叶斯推理,通常称为变分贝叶斯(VB),已成功应用于其他应用领域。我们调查了当前可用的R和Python VB软件在对现实大规模临床观察数据进行变分贝叶斯潜类分析(LCA)时的性能和特征。我们使用了Optum TM电子健康记录(EHR)中包含儿科患者的真实数据集,该数据集包含二型糖尿病的风险指标,这是儿科患者罕见的一种形式。这项工作的目标是验证一个适用于广泛性和可扩展性的贝叶斯患者表型模型,并且至关重要的是,它可以应用于一个现实大规模的临床数据集。我们发现当前可用的自动VB方法对于初始条件、模型定义、算法超参数和梯度优化器的选择非常敏感。使用VB实现贝叶斯LCA模型具有一定挑战性,但与MCMC相比,在计算性能方面取得了合理的结果。

作者:Brian Buckley, Adrian O'Hagan, Marie Galligan

论文ID:2303.13619

分类:Applications

分类简称:stat.AP

提交时间:2023-03-27

PDF 下载: 英文版 中文版pdf翻译中