Reddit在数据科学和知识处理中的可用性探索
摘要:Reddit:一个大规模、分类、开放访问的数据集,并且是“几乎任何主题”的有用数据来源。基于对Reddit本身相关的180篇手动注释论文和从流行科学论文数据库获取的数据进行了分析。最后,介绍了一个开源工具,可以轻松访问Reddit资源,并对Reddit如何涵盖选定的主题进行探索性数据分析。这些功能可以作为对Reddit适用性更广泛的探索的前导分析。
作者:Jan Sawicki, Maria Ganzha, Marcin Paprzycki, Amelia Bu{a}dicu{a}
论文ID:2110.02158
分类:Information Retrieval
分类简称:cs.IR
提交时间:2023-04-17