从网络中提取与购物兴趣相关的产品类型

摘要:推荐不同类型的产品对于顾客的购物体验很重要,特别是当顾客在寻找与他们的高级购物兴趣(如徒步旅行)相关的产品时。然而,在电子商务产品目录中,兴趣与产品类型之间通常缺乏连接,并且手动构建这种连接非常耗时,因为潜在的兴趣众多,这阻碍了我们建立一个易于访问的知识系统。为了建立这种连接,我们提出从包含手工制作的兴趣与产品类型推荐的网页中提取产品类型。提取任务被定义为二进制HTML节点分类,根据我们目标网页的一般观察,目标网页中的HTML节点只能呈现一个产品类型短语。为此,我们引入了TrENC,即Tree-Transformer Encoders for Node Classification。它通过修改的注意力机制改进了节点之间的依赖关系建模,保留了长期的兄弟节点和祖先-子孙节点关系。TrENC还将兴趣注入节点特征以获得更好的语义表示。经过训练在关于有限兴趣的页面上,TrENC可以应用于其他未被观察到的兴趣。在我们手工构建的数据集WebPT上的实验证明,在零-shot设置下,TrENC的表现优于最佳基准模型2.37个F1点。这种性能表明了构建兴趣与产品类型关系的可行性,并将其用于实现搜索和推荐等下游应用。

作者:Yinghao Li, Colin Lockard, Prashant Shiralkar, Chao Zhang

论文ID:2305.14549

分类:Information Retrieval

分类简称:cs.IR

提交时间:2023-05-25

PDF 下载: 英文版 中文版pdf翻译中