高效的在线决策树学习与主动特征获取

摘要:在线构建决策树是一个经典的机器学习问题。现有的工作通常假设每个传入的数据点的特征值已经可用。然而,在许多实际应用中,特征值和标签都是事先未知的,只能以一定的成本获取。例如,在医学诊断中,医生必须选择对患者进行哪些检查(即进行昂贵的特征查询),以便做出诊断决策(即预测标签)。我们提供了一个新的视角来解决这个实际挑战。我们的框架包括一个嵌入在线学习方案的主动规划预测器,并对几种信息获取函数进行了研究。具体地,我们利用基于自适应次模性的替代信息获取函数来主动查询具有最小成本的特征值,同时使用后验抽样方案来保持在线预测的低遗憾。我们通过对各种真实数据集的大量实验验证了我们框架的效率和有效性。我们的框架还自然地适应了在线学习与概念漂移的挑战性环境,并且在更灵活的同时与基准模型保持竞争力。

作者:Arman Rahbar, Ziyu Ye, Yuxin Chen, Morteza Haghir Chehreghani

论文ID:2305.02093

分类:Machine Learning

分类简称:cs.LG

提交时间:2023-08-28

PDF 下载: 英文版 中文版pdf翻译中