另一个 ICU 基准测试:一种用于临床机器学习的灵活多中心框架

摘要:机器学习在医疗应用方面近年来变得越来越受欢迎。由于电子健康记录中可用数据的丰富性,重症监护室(ICU)是机器学习的天然发展环境。已经提出了模型来解决许多ICU预测任务,例如并发症的早期检测。尽管作者经常报告最先进的性能,但验证其优越性的问题很具有挑战性。数据集和代码并不总是公开发布的,而且难以复现队列定义、预处理流程和训练设置。本文引入了Yet Another ICU Benchmark (YAIB) ,这是一个模块化框架,可以使研究人员定义可复现和可比较的临床机器学习实验;我们提供了从队列定义到模型评估的端到端解决方案。该框架本地支持大多数开放获取的ICU数据集(MIMIC III/ IV,eICU,HiRID,AUMCdb),并且可以轻松适应未来的ICU数据集。结合透明的预处理流程和可扩展的多个机器学习和深度学习模型的训练代码,YAIB实现了统一的模型开发。我们的基准测试包括与临床医生合作开发的五个预定的已建立预测任务(死亡率、急性肾损伤、败血症、肾功能和住院天数)。通过设计,添加更多任务是直接的。使用YAIB,我们展示了数据集选择、队列定义和预处理对预测性能的重大影响,往往比模型类别更大,这表明YAIB作为综合基准测试工具的迫切需求。我们将我们的工作提供给临床机器学习社区,以加速方法的发展并实现真实世界的临床应用。软件存储库:https://github.com/rvandewater/YAIB.

作者:Robin van de Water, Hendrik Schmidt, Paul Elbers, Patrick Thoral, Bert Arnrich, Patrick Rockenschaub

论文ID:2306.05109

分类:Machine Learning

分类简称:cs.LG

提交时间:2023-09-01

PDF 下载: 英文版 中文版pdf翻译中