随机块模型中半监督学习的大偏差

摘要:在图上的社区检测中,半监督学习问题涉及推断给定连接结构和有限数量的公开节点标签的每个节点的地面真实成员资格。不同的公开标签子集可以在原理上导致更高或更低的信息增益,并引发不同的重建准确性。在稠密随机块模型的框架中,我们采用统计物理方法推导了这个问题的大偏差分析,其中考虑高维极限。该分析允许刻画典型行为周围的波动,捕捉相关标签选择的影响,并估计它们在相同大小子集中的信息性和稀有性。我们发现了重建准确性与推理问题的后验度量关联的自由能之间的非单调关系的理论证据。我们进一步讨论了在社区检测中的主动学习应用可能的影响。

作者:Hugo Cui, Luca Saglietti, Lenka Zdeborov''a

论文ID:2108.00847

分类:Disordered Systems and Neural Networks

分类简称:cond-mat.dis-nn

提交时间:2022-03-22

PDF 下载: 英文版 中文版pdf翻译中