网站和文档的实用语义分析
摘要:网站现在是普通产品,有必要明确网站的质量概念。网站的质量可能与易访问性有关,也可能与网站是否更新和一致性等其他标准有关。由于网站可能会经常更新、有多个作者,部分内容可能是自动生成的,因此很难保证一致性。同一信息可能在不同的地方出现,也可能在数据或元数据中出现,这就需要进行一致性检查。本文将程序与网站相类比。我们提供了一些希望指定的语义约束的示例(例如,主题目录中类别和子类别的含义之间的约束,学术网站的组织图与网站其他部分的一致性)。我们介绍了自然语义快速,一种用于指定编程语言语义的方法,这启发了我们的工作。然后,我们提出了一种用于网站语义约束的规范语言,与众所周知的“make”程序结合使用,可以通过将规范编译为Prolog代码来生成一些网站验证工具。我们将我们的方法应用于一个大型XML文档,该文档是我们研究所活动报告的科学部分,用于追踪错误或不一致之处,并构建一些可以被研究所管理层使用的指标。
作者:Thierry Despeyroux (INRIA Rocquencourt / INRIA Sophia Antipolis)
论文ID:cs/0510025
分类:Information Retrieval
分类简称:cs.IR
提交时间:2007-05-23