相互污染模型的净化

摘要:通过相互混合模型来刻画许多机器学习问题。在这些问题中,我们观察到来自未知基本分布集合的不同凸组合的多个随机样本,并且目标是推断这些基本分布。本文考虑了基本分布定义在任意概率空间上的一般情况。我们研究了在这一一般设置中出现的三个常见机器学习问题:带有标签噪声的多类别分类,混合成员模型的分离以及带有部分标签的分类。对于每种情况,我们给出了可识别性的充分条件,并提出了适用于无限样本和有限样本情况的算法,附带有性能保证。

作者:Julian Katz-Samuels, Gilles Blanchard, and Clayton Scott

论文ID:1710.01167

分类:Machine Learning

分类简称:stat.ML

提交时间:2019-04-12

PDF 下载: 英文版 中文版pdf翻译中