不准确的标签分布学习-arXiv论文预印本中文版

不准确的标签分布学习

摘要：标签分布学习（LDL）训练一个模型来预测一组标签（称为标签分布）与实例的相关性。以往的LDL方法都假设训练实例的标签分布是准确的。然而，为训练实例注释高度准确的标签分布是耗时且昂贵的，在现实中收集到的标签分布通常是不准确的，并且受到注释错误的干扰。本文首次研究了不准确LDL的问题，即开发一个能够处理噪声标签分布的LDL模型。我们假设噪声标签分布矩阵是一个理想标签分布矩阵与一个稀疏噪声矩阵的线性组合。因此，不准确LDL的问题成为一个逆问题，其目标是从噪声标签分布中恢复理想的标签分布和噪声矩阵。我们假设理想的标签分布矩阵是低秩的，这是由于标签之间的相关性，并利用图表达的实例的局部几何结构来辅助恢复理想的标签分布。这基于相似的实例很可能分享相同的标签分布的前提。所提出的模型最终被形式化为一个图正则化的低秩和稀疏分解问题，并通过交替方向乘子法进行数值求解。此外，使用专用目标函数来引导LDL中的标签分布预测模型，考虑到恢复的标签分布。在多个来自不同真实世界任务的数据集上进行的大量实验证实了所提方法的有效性。

作者：Zhiqiang Kou, Yuheng Jia, Jing Wang, Xin Geng

论文ID：2302.13000

分类：Machine Learning

分类简称：cs.LG

提交时间：2023-08-29

PDF 下载： 英文版中文版pdf翻译中