PromptRank:使用提示进行无监督的关键词提取

摘要:使用基于编码器-解码器架构的预训练语言模型,我们提出了一种简单而有效的无监督方法PromptRank,用于关键词提取任务。PromptRank将文档送入编码器,并利用设计的提示信息通过解码器计算生成候选关键词的概率。我们在六个广泛使用的基准测试数据集上对PromptRank进行了全面评估。相对于SOTA方法MDERank,在返回5个、10个和15个结果时,PromptRank的F1分数分别提高了34.18%、24.87%和17.57%。这证明了使用提示进行无监督关键词提取的巨大潜力。我们将我们的代码发布在https://github.com/HLT-NLP/PromptRank上。

作者:Aobo Kong, Shiwan Zhao, Hao Chen, Qicheng Li, Yong Qin, Ruiqi Sun and Xiaoyan Bai

论文ID:2305.04490

分类:Information Retrieval

分类简称:cs.IR

提交时间:2023-05-16

PDF 下载: 英文版 中文版pdf翻译中