通过Bagging决策树优化信号显著性

摘要:一种用于优化信号显著性或任何其他适用于高能物理(HEP)数据分析的分类评估指标的算法被描述。该算法在训练数据的许多自举复制品上训练决策树,每棵树都需要优化信号显著性或任何其他选择的评估指标。然后,通过建立的树进行简单的多数决策对新数据进行分类。使用该算法对巴巴尔(BaBar)上的辐射轻子衰变B->gamma l nu进行研究后发现,其性能优于所有其他尝试的分类器,包括强大的方法如提升决策树(boosted decision trees)。在B->gamma e nu通道中,该算法将原始方法(用于B->gamma l nu分析)获得的预期信号显著性从2.4 sigma提高到3.0 sigma。

作者:I. Narsky

论文ID:physics/0507157

分类:Data Analysis, Statistics and Probability

分类简称:physics.data-an

提交时间:2017-08-23

PDF 下载: 英文版 中文版pdf翻译中