基于文本嵌入的方法测量专利间技术相似度--工作流程、代码和应用
摘要:一种有效可伸缩的方法来测量专利之间的技术相似性,将自然语言处理中的嵌入技术与最近邻近似相结合。利用这种方法,我们能够计算所有专利之间的现有相似性,从而将整个专利领域表示为一个技术网络。我们以电动车技术为例,通过各种方式验证了技术签名和相似性,并展示了它们在衡量知识流动、绘制技术变革图和创建专利质量指标方面的实用性。因此,本文为基于文本的专利分析指标的不断增长的文献作出了贡献。我们提供了关于该方法的详细文档,包括所有代码、指标和中间输出。详见https://github.com/daniel-hain/patent\_embedding\_research。
作者:Daniel Hain, Roman Jurowetzki, Tobias Buchmann, Patrick Wolf
论文ID:2003.12303
分类:Digital Libraries
分类简称:cs.DL
提交时间:2021-11-11