Tube2Vec:YouTube频道的社交和语义嵌入

摘要:使用YouTube的数据进行研究通常探索频道和视频的社交和语义维度。通常,分析依赖于对内容和内容创作者的劳动密集型手动注释,通常通过低召回率的方法(例如关键词搜索)找到。这里,我们探索了一种替代方法,使用机器学习获得的潜在表示(嵌入)。使用在Reddit上共享的大型YouTube链接数据集,我们创建了捕捉社交分享行为、视频元数据(标题、描述等)和YouTube视频推荐的嵌入。我们使用众包和现有数据集对这些嵌入进行评估,发现推荐嵌入在捕捉社交和语义维度方面表现出色,尽管社交分享嵌入与现有的党派得分更好地相关。我们分享了捕捉44000个YouTube频道的社交和语义维度的嵌入,以便未来YouTube研究的受益:https://github.com/epfl-dlab/youtube-embeddings.

作者:L''eopaul Boesinger, Manoel Horta Ribeiro, Veniamin Veselovsky, Robert West

论文ID:2306.17298

分类:Computers and Society

分类简称:cs.CY

提交时间:2023-07-03

PDF 下载: 英文版 中文版pdf翻译中