一个音韵和形态词汇数据库的视角下统一词典

摘要:将两个具有不兼容格式和互补信息的意大利词汇资源合并成一个统一的词汇资源(UL)的可行性,定义方法和程序进行调查。采用的策略和指定的程序以及合并任务的驱动标准一起进行描述,追求人类和计算机努力之间的平衡。通过使用简单快速的匹配程序,最大化了UL的覆盖范围。第二个目标是利用这个新获取的资源来实现CLIPS词汇数据库的音韵和形态层。实现这些新层并将它们与已经存在的句法和语义层联系起来并不是一项琐碎的任务。在模型所施加的约束,对体系结构层面的影响以及为了使整个数据库有效地“说话”而采取的解决方案被介绍。讨论了优势与不足之间的差异。

作者:Federico Calzolari, Michele Mammini, Monica Monachini

论文ID:cs/0612062

分类:Information Retrieval

分类简称:cs.IR

提交时间:2007-05-23

PDF 下载: 英文版 中文版pdf翻译中