医学时间序列预测的稀疏多输出高斯过程
摘要:医院患者实时监测的情景下,利用临床协变量和实验室测试提供的所有信息进行患者健康状况的高质量推断对于成功的医疗干预和改善患者结果至关重要。开发一个可以从观察型大规模电子健康记录学习并进行准确实时预测的计算框架是一个关键步骤。在这项工作中,我们开发并探索了一种基于高斯过程回归的贝叶斯非参数模型,用于医院患者监测。我们提出了MedGP,这是一个统计框架,结合了24个临床和实验室协变量,并支持一个丰富的参考数据集,可以从中推断和利用观察到的协变量之间的关系,从而实现对患者状态的高质量推断。为此,我们开发了一个高度结构化的稀疏高斯过程核,在估计临床协变量、患者和患者观察中的周期性之间的相关性的同时,可以进行数以万计的时间点的可计算处理。MedGP相对于当前的方法有许多优势,包括:(i)不需要时间序列数据的对齐,(ii)量化预测的置信区间,(iii)利用广泛而丰富的患者数据库,(iv)推断出可解释的临床协变量之间的关系。我们对MedGP在来自两个医疗数据集的三个患者亚组的在线预测任务中的结果进行评估和比较,涉及8,043名患者。我们发现MedGP在不同疾病亚组和研究中几乎对所有协变量的在线预测都优于基线方法。公开的代码在https://github.com/bee-hive/MedGP。
作者:Li-Fang Cheng, Gregory Darnell, Bianca Dumitrascu, Corey Chivers, Michael E Draugelis, Kai Li, Barbara E Engelhardt
论文ID:1703.09112
分类:Machine Learning
分类简称:stat.ML
提交时间:2018-06-25