具有多变量纵向内生协变量的随机生存森林

摘要:使用完整的患者病史来预测临床事件的个体风险仍然是个性化医学面临的主要挑战。在计算个体动态预测的方法中,联合模型具有利用所有可用信息并考虑到退治的优点。然而,它们只能针对非常少量的纵向预测因子进行限制。我们的目标是提出一种创新性的替代方案,使用可能大量的纵向预测因子来预测事件概率。我们开发了DynForest,它是竞争风险随机生存森林的扩展,可以处理内生纵向预测因子。在树的每个节点,时变预测因子被转化为时间固定的特征(使用混合模型),以用作将受试者分为两个子组的候选人。个体事件概率在每个树中由Aalen-Johansen估计器在叶子节点中进行估计,根据患者的预测因子历史进行分类。最终的个体预测是树特定个体事件概率的平均值。我们进行了一项模拟研究,以展示DynForest在小维度环境(与联合模型相比)和大维度环境(与忽略有信息退治的回归校准方法相比)中的性能。我们还将DynForest应用于(i)根据认知、功能、血管和神经退化标志物的重复测量来预测老年人的痴呆个体概率,以及(ii)量化每种标志物对痴呆预测的重要性。我们的方法在R软件包DynForest中实施,为从任意数量的纵向内生预测因子预测事件提供了一种新颖且合适的解决方案。

作者:Anthony Devaux (BPH), Catherine Helmer (BPH), Robin Genuer (SISTM, BPH), C''ecile Proust-Lima (BPH)

论文ID:2208.05801

分类:Machine Learning

分类简称:stat.ML

提交时间:2023-02-10

PDF 下载: 英文版 中文版pdf翻译中