基于移动性的COVID-19病例预测模型的公平性评估
摘要:COVID-19爆发后,分析和测量人类流动性变得越来越重要。许多研究已经探索了随时间的空间时间趋势,研究了与其他变量的关联,评估了非药物干预措施(NPIs),并使用流动性数据预测或模拟了COVID-19的传播。尽管公开可用的流动性数据有很多好处,但仍然有一个重要问题尚未解答:使用流动性数据的模型在人口统计群体中的表现是否公平?我们假设,在训练预测模型时,流动性数据中的偏差可能会导致对某些人口统计群体的预测不公正地更不准确。为了测试我们的假设,我们使用SafeGraph数据在美国县一级应用了两个基于流动性的COVID感染预测模型,并将模型性能与社会人口特征进行了相关分析。研究结果显示,模型的性能存在一种针对特定人口统计特征的系统性偏差。具体而言,这些模型倾向于偏爱人口较多、受教育水平较高、富裕、年轻、城市化且非黑人主导的县。我们假设目前许多预测模型使用的流动性数据倾向于对老年人、贫困地区、非白人和教育水平较低的地区捕捉较少信息,进而对这些地区COVID-19预测的准确性产生负面影响。最终,这项研究指出需要改进数据收集和抽样方法,以便准确代表不同人口统计群体的流动性模式。
作者:Abdolmajid Erfani, Vanessa Frias-Martinez
论文ID:2210.03901
分类:Computers and Society
分类简称:cs.CY
提交时间:2023-02-17