数据自适应主动采样用于高效的图感知分类-arXiv论文预印本中文版

数据自适应主动采样用于高效的图感知分类

摘要：使用主动采样方法对表示二元分类训练数据的图节点进行采样。图可以是给定的，也可以使用节点特征之间的相似性度量构建。利用图进行分类建立在标签在相邻节点之间相关的分类马尔可夫随机场(MRF)的前提下。然后进一步将该模型放松为具有连续值标签的高斯(M)MRF，这种近似不仅减少了分类模型的组合复杂性，而且还提供了最佳无偏的软预测器。所提出的采样策略基于查询预计泄露最大变化到GMRF的节点的标签，并且从这个意义上来说，它是平均上最具信息的策略。这种策略包含了几种预期模型变化的度量，包括不确定性采样，方差最小化和基于Sigma-优化准则的采样。还引入了一种简单而有效的启发式方法，通过考虑模型标签预测的置信度，来增加采样器的探索能力，并减少结果分类器的偏差。这些新颖的采样策略基于那些在无需重新训练模型情况下即可获得的量，使它们在计算上高效且可扩展到大型图。使用合成数据和真实数据进行的数值测试表明，即使在减少运行时间的情况下，所提出的方法也能达到与现有技术相媲美或更好的准确性。

作者：Dimitris Berberidis, Georgios B. Giannakis

论文ID：1705.07220

分类：Machine Learning

分类简称：stat.ML

提交时间：2018-10-17

PDF 下载： 英文版中文版pdf翻译中