biquality-learn:一个用于双质量学习的Python库
摘要:数据挖掘的民主化取得了广泛成功,部分原因在于强大且易于使用的机器学习库。这些库特别适用于处理监督学习。然而,在实践中,强监督信号是稀缺的,实践者必须采用弱监督。除了监督的弱点外,数据集漂移是在实际应用机器学习模型时发生的另一种现象。因此,双质量学习被提出作为一种机器学习框架,能够处理多种监督的弱点和数据集漂移,而不对它们的性质和水平做任何假设,通过依赖一个由干净标记和代表性样本组成的小型可信数据集。因此,我们提出了biquality-learn:一个用于双质量学习的Python库,具有直观一致的API,可以从双质量数据中学习机器学习模型,使用经过验证的算法,对每个人来说都易于访问和使用,并使研究人员能够在双质量数据上以可重复的方式进行实验。
作者:Pierre Nodet and Vincent Lemaire and Alexis Bondu and Antoine Cornu''ejols
论文ID:2308.09643
分类:Machine Learning
分类简称:cs.LG
提交时间:2023-08-21