一种新的有监督非线性映射
摘要:监督映射方法将多维标记数据投影到二维空间中,试图保持数据的相似性和类别的拓扑结构。监督映射有助于用户理解底层的原始类别结构,并以可视化的方式对新数据进行分类。许多方法都设计了监督映射,但其中很多方法在映射之前修改了原始距离,导致原始数据的相似性被破坏,甚至有重叠的类别也会被分开映射,忽略了它们的原始拓扑结构。我们提出了一种替代的监督映射方法——ClassiMap。映射会带来扭曲,可以分为 tear(将接近的点映射得很远)和 false neighborhood(将远离的点映射为邻居)。一些映射方法偏向于前者,而其他方法偏向于后者。ClassiMap在这些映射方法之间进行切换,以使 tear 倾向于出现在类别之间,而 false neighborhood 出现在类别内部,更好地保留了类别的拓扑结构。此外,我们还提出了两个新的客观标准,以代替通常的主观视觉检查,以进行公正的监督映射方法比较。在我们对合成和真实数据集的实验中,ClassiMap 被证明是最好的监督映射方法。
作者:Sylvain Lespinats, Anke Meyer-Baese, Michael Aupetit
论文ID:1203.2021
分类:Information Retrieval
分类简称:cs.IR
提交时间:2012-03-12