排列决策树

摘要:使用决策树模型时存在一个严重限制,即无法捕捉数据实例之间的顺序依赖关系。本文首次提出将压缩复杂性度量(ETC)作为一个无序度量用于决策树模型中,与Shannon熵和Gini不纯度相比,基于ETC的结构不纯度能够捕捉数据的顺序依赖关系。我们引入了排列装袋的概念,利用排列决策树而无需随机特征选择和子采样。我们将提出的排列装袋决策树模型与随机森林进行了比较。我们的模型不假定数据实例是独立和同分布的,适用于需要尊重数据实例的时间顺序的场景。

作者:Harikrishnan N B and Nithin Nagaraj

论文ID:2306.02617

分类:Machine Learning

分类简称:cs.LG

提交时间:2023-08-15

PDF 下载: 英文版 中文版pdf翻译中