成人图像分类的链接图分析
摘要:保护图像搜索引擎用户免受不良结果影响的关键是构建成人图像分类器。利用网站到图片的链接信息来创建这样一个分类器。这些链接被表示为一个二分图,其中每个顶点都有成人度和正派度的评分。图片顶点的评分初始化为零,网站顶点的评分根据基于文本的网站分类器进行初始化。文章描述了一个在网站-图片图中传播评分的迭代算法。获得的评分用于通过选择适当的阈值来分类图片。对互联网规模的数据进行的实验表明,所考虑的算法与一个简单的算法相比,将分类查全率提高了17%,该算法将图像分类为成人图像,如果它与至少一个成人网站有链接(在相同的准确率水平上)。
作者:Evgeny Kharitonov, Anton Slesarev, Ilya Muchnik, Fedor Romanenko, Dmitry Belyaev, Dmitry Kotlyarov
论文ID:1007.3208
分类:Information Retrieval
分类简称:cs.IR
提交时间:2010-07-20