通过加权密度集成预测传染病流行-arXiv论文预印本中文版

通过加权密度集成预测传染病流行

摘要：用于传染病动态的准确可靠的预测对计划减少或预防疾病传播的公共卫生组织非常有价值。针对这一任务，已经开发了各种各样的模型，使用不同的模型结构、协变量和预测目标。经验表明，这些模型的性能有所差异；某些模型在不同季节或季节的不同阶段表现得更好或更差。集合方法将多个模型合并，以获得一个单一的预测结果，利用每个模型的优势。我们考虑了一系列集合方法，每个方法将感兴趣目标的预测密度形成为由组成模型的预测密度的加权求和。在最简单的情况下，每个组成模型被赋予相等的权重；而在最复杂的情况下，权重根据地区、预测目标、预测时的季节周数、组成模型的不确定性测度以及最近的疾病发病观察结果而变化。我们应用这些方法来预测美国国家和地区水平的流感季节起止时间和严重程度，使用了三个组成模型。我们在回顾性预测的14个季节（1997/1998年-2010/2011年）上训练了这些模型，并在之后五个流感季节中评估了每个模型的前瞻性、样本外性能。在这个测试阶段，集合方法的整体表现与最佳组成模型相似，但比组成模型在不同季节上的表现更一致。集合方法有望向公共卫生决策者提供更可靠的预测结果。

作者：Evan L. Ray and Nicholas G. Reich

论文ID：1703.10936

分类：Machine Learning

分类简称：stat.ML

提交时间：2018-07-04

PDF 下载： 英文版中文版pdf翻译中