构建集成堆栈的增强方法
摘要:演化集成学习的一种方法:使用boosting构建程序的堆栈。每次boosting都会识别出一个冠军和一个残余数据集,即到目前为止未正确分类的训练记录。下一个程序只针对残余数据集进行训练,直到达到最大集成大小或没有进一步的残余数据为止。对残余数据集进行训练可以主动降低训练成本。将整个集成作为一个堆栈部署,意味着可能只需要一个分类器来进行预测,从而提高了可解释性。通过基准测试研究,说明了与当前最先进的演化集成学习算法的预测准确性的竞争力,并提供了数量级更简单的解决方案。使用高基数数据集进行进一步的基准测试表明,该方法比XGBoost更准确和高效。
作者:Zhilei Zhou and Ziyu Qiu and Brad Niblett and Andrew Johnston and Jeffrey Schwartzentruber and Nur Zincir-Heywood and Malcolm Heywood
论文ID:2211.15621
分类:Neural and Evolutionary Computing
分类简称:cs.NE
提交时间:2022-11-29