面向医疗应用的机器学习系统质量管理
摘要:机器学习系统在临床常规中的使用仍受制于医疗设备认证的必要性和难以在临床的质量管理系统中实施的困难。在这个背景下,对用户来说,关键问题是如何确保可靠的模型预测,以及如何定期评估模型结果的质量。在本文中,我们首先回顾了为何常见的样本外表现指标不足以评估模型预测的鲁棒性。我们讨论了临床实施机器学习系统的一些概念基础,并主张供应商和用户都应承担一定的责任,正如对高风险医疗设备的常规做法一样。在这条线上,重新审视了处理机器学习模型鲁棒性(或其缺乏)的最佳实践。我们提出了AAPM Task Group 100报告第283号的方法论作为一个自然框架,用于开发包含机器学习系统的临床流程的质量管理程序。通过一个明确但通用的例子加以说明。我们的分析展示了在这个框架中如何评估机器学习系统的风险,而不考虑其鲁棒性评估。特别是,我们强调了如何将机器学习系统的可解释性程度系统地纳入风险评估和质量管理系统的开发中。
作者:Lorenzo Mercolli and Axel Rominger and Kuangyu Shi
论文ID:2210.08881
分类:Medical Physics
分类简称:physics.med-ph
提交时间:2022-10-18