如何模拟逼真的生存数据?一项比较逼真模拟模型的研究

摘要:用于模型比较的现实数据对于特定的背景非常重要,以便进行适当且客观的方法比较。对于许多用例,方法比较的基准数据集已经可以在线获取。然而,在大多数医学应用程序中,特别是肿瘤学临床试验中,缺乏适当的基准数据集,因为患者数据可能是敏感的,因此无法公开发布。一个潜在的解决方案是模拟研究。然而,有时候不清楚哪些模拟模型适合生成真实数据。一个挑战是可能需要对分布做出不现实的假设。我们的方法是使用重构的基准数据集作为模拟的基础,具有以下优点:实际属性已知,可以模拟更真实的数据。有几种方法可以从基准数据集中模拟真实数据。我们研究了基于核密度估计、拟合分布、案例重采样和条件自举的模拟模型。为了对特定生存设置中哪种模型最适合提出建议,我们进行了比较性的模拟研究。由于不可能在一篇论文中为所有可能的生存设置提供建议,因此我们的重点是为二期肺癌研究提供真实的模拟模型。为此,我们从最近的研究中重构了基准数据集。我们使用运行时间和不同的准确性度量(效应大小和p值)作为比较标准。

作者:Maria Thurow, Ina Dormuth, Christina Sauer, Marc Ditzhaus and Markus Pauly

论文ID:2308.07842

分类:Applications

分类简称:stat.AP

提交时间:2023-08-16

PDF 下载: 英文版 中文版pdf翻译中