使用Elasticsearch进行机构消岐中的实体识别

摘要:自动识别学术出版物元数据中的机构归属对于监测和分析科学产出的趋势尤为重要,特别是在开放科学环境中。我们提出了一种基于Elasticsearch的注册表自动对齐方法。所提出的方法是模块化的,允许用户选择对齐标准,从而使用户能够控制方法的精确度和召回率。本文提出了一种自动对齐三个注册表(国家、GRID.ac和法国研究实验室目录RNSR)的实现,并对其性能进行了分析。 自动对齐学术出版物元数据中的机构归属的方法及性能分析

作者:Anne L'H^ote, Eric Jeangirard

论文ID:2110.01958

分类:Digital Libraries

分类简称:cs.DL

提交时间:2021-10-06

PDF 下载: 英文版 中文版pdf翻译中