医学影像与数据资源中心开放数据共享的人口统计代表性纵向评估

摘要:对比美国普查数据和疾病控制与预防中心报告的COVID-19阳性病例数,本研究旨在量化MIDRC主要成像数据集的人口统计特征的长期代表性。使用Jensen Shannon距离(JSD)来测量MIDRC数据中所有唯一患者与2020年美国普查数据以及所有唯一COVID-19阳性患者与CDC报告的病例数的分布相似性。在年龄、性别、种族、民族和种族与民族的交集等人口统计类别中评估这些分布。结果显示,以民族和种族的方式衡量MIDRC数据的代表性受到CDC病例统计数据在这些类别中报告的比例的影响。性别和种族的分布随时间保持了其代表性水平。综上所述,随着贡献机构和受试者总数的增加,MIDRC的开放式医学成像数据集在公共数据平台上的代表性已经发生了变化。使用JSD等指标有助于衡量代表性,这是公平和可推广的AI算法开发的一步。

作者:Heather M. Whitney, Natalie Baughan, Kyle J. Myers, Karen Drukker, Judy Gichoya, Brad Bower, Weijie Chen, Nicholas Gruszauskas, Jayashree Kalpathy-Cramer, Sanmi Koyejo, Rui C. S''a, Berkman Sahiner, Zi Zhang, Maryellen L. Giger

论文ID:2303.10501

分类:Medical Physics

分类简称:physics.med-ph

提交时间:2023-03-21

PDF 下载: 英文版 中文版pdf翻译中