网站和文档的实用语义分析-arXiv论文预印本中文版

网站和文档的实用语义分析

摘要：网站现在是普通产品，有必要明确网站的质量概念。网站的质量可能与易访问性有关，也可能与网站是否更新和一致性等其他标准有关。由于网站可能会经常更新、有多个作者，部分内容可能是自动生成的，因此很难保证一致性。同一信息可能在不同的地方出现，也可能在数据或元数据中出现，这就需要进行一致性检查。本文将程序与网站相类比。我们提供了一些希望指定的语义约束的示例（例如，主题目录中类别和子类别的含义之间的约束，学术网站的组织图与网站其他部分的一致性）。我们介绍了自然语义快速，一种用于指定编程语言语义的方法，这启发了我们的工作。然后，我们提出了一种用于网站语义约束的规范语言，与众所周知的“make”程序结合使用，可以通过将规范编译为Prolog代码来生成一些网站验证工具。我们将我们的方法应用于一个大型XML文档，该文档是我们研究所活动报告的科学部分，用于追踪错误或不一致之处，并构建一些可以被研究所管理层使用的指标。

作者：Thierry Despeyroux (INRIA Rocquencourt / INRIA Sophia Antipolis)

论文ID：cs/0510025

分类：Information Retrieval

分类简称：cs.IR

提交时间：2007-05-23

PDF 下载： 英文版中文版pdf翻译中