预测少数社区中的阿片类药物使用结果-arXiv论文预印本中文版

预测少数社区中的阿片类药物使用结果

摘要：机器学习算法有时会加剧基于种族、性别和其他因素的卫生差距。在小规模部署的算法中，或者在少数群体中，对潜在偏见的研究工作有限。了解潜在偏见的性质可能改善对各种健康结果的预测。作为一个案例研究，我们使用了来自少数群体中从事非医学使用处方阿片类药物和/或海洛因的539名年轻成年人的数据。通过以下贡献，我们解决了所示问题：1）使用机器学习技术，我们对数据集中参与者的一系列阿片类药物使用结果进行了预测；2）我们评估了仅在多数子样本（例如，非西班牙裔/拉丁裔，男性）上训练的算法是否能够准确预测少数子样本（例如，拉丁裔，女性）的阿片类药物使用结果。结果表明，我们数据的随机样本上训练的模型能够高精度地预测一系列阿片类药物使用结果。然而，当我们在多数子样本上训练模型，并在少数子样本上测试这些模型时，我们注意到预测精度下降。我们认为，各种文化因素和系统性歧视形式无法通过大多数子样本的数据捕捉到。广泛而言，为了使预测有效，模型应该基于包含预测对象群体的足够代表性的数据进行训练。相关方可以利用我们的研究结果，减少在预测少数群体阿片类药物使用结果方面的偏见。

作者：Abhay Goyal, Nimay Parekh, Lam Yin Cheung, Koustuv Saha, Frederick L Altice, Robin O'hanlon, Roger Ho Chun Man, Christian Poellabauer, Honoria Guarino, Pedro Mateu Gelabert, Navin Kumar

论文ID：2307.03083

分类：Computational Engineering, Finance, and Science

分类简称：cs.CE

提交时间：2023-07-07

PDF 下载： 英文版中文版pdf翻译中