因果森林中的变量重要性:分解治疗效应的异质性

摘要:因果随机森林提供了异质性治疗效果的高效估计。然而,森林算法也因为其黑盒的本质而出名,因此不能表征输入变量如何参与治疗效果的异质性,这是一个实际应用的强大限制。在本文中,我们为因果森林开发了一种新的重要变量算法,用于量化每个输入对治疗效果异质性的影响。所提出的方法借鉴了广泛用于回归问题的丢弃和重新学习原则。重要的是,我们展示了如何处理没有混淆变量的森林重新训练。如果混淆变量未涉及到治疗效果的异质性,局部居中步骤会强制一致性的重要性度量。否则,当混淆变量也影响异质性时,我们在重新训练的因果森林中引入一个校正项以恢复一致性。此外,对模拟、半合成和真实数据的实验显示了我们重要性度量的良好性能,该方法在多个测试案例中胜过竞争对手。实验还表明,我们的方法可以高效地扩展到变量组,为实际应用提供关键的洞察。

作者:Cl''ement B''enard, Julie Josse (PREMEDICAL)

论文ID:2308.03369

分类:Machine Learning

分类简称:stat.ML

提交时间:2023-08-08

PDF 下载: 英文版 中文版pdf翻译中