多语种文档的半自动索引化
摘要:通过不断增长的数字图书馆和互联网的重要性,越来越多的电子文本对广泛分散的公众而言变得可访问。这需要适当的工具来促进不同语言的文件的索引、存储和检索。我们提出了一种半自动索引的电子文档方法和多语言词库的构建,可用于查询形式和信息检索。我们使用特殊的字典和用户互动来解决歧义,并找到合适的语言和适当的抽象无语言的词语。抽象词库通过新的索引文件逐渐更新,并用于在查询到文档库中与词有关的文档进行搜索。
作者:Ulrich Schiel, Ianna M. Sodre Ferreira de Souza and Edberto Ferneda
论文ID:cs/9902022
分类:Digital Libraries
分类简称:cs.DL
提交时间:2007-05-23