ONER:从PubMed摘要的机构归属字符串识别工具

摘要:从与生物医学相关的文章的机构句子中自动提取机构名称对制药营销行业、健康医疗资助机构和公共卫生官员来说非常有意义。对其他科学家来说,这也将有助于规范化作者姓名、自动创建引文、索引文章和识别潜在资源或合作者。目前在PubMed中索引了超过1800万篇与生物医学研究相关的文章,从中获取的信息可以有效地节省政府机构在了解科学领域、包括关键意见领袖和卓越中心方面所花费的大量时间和资源。我们提取机构名称的过程包括多层次的规则匹配和多个字典。该系统在提取机构名称方面达到了99.6%的F值。

作者:Siddhartha Jonnalagadda, Philip Topham, Graciela Gonzalez

论文ID:1001.4274

分类:Digital Libraries

分类简称:cs.DL

提交时间:2010-05-17

PDF 下载: 英文版 中文版pdf翻译中