文本中的本地层次结构生成本体

摘要:在可视化文本数据和导航文本集合的背景下,我们研究了"层次结构"的概念。通过超度量拓扑给出了"层次结构"的形式化框架。这为我们构建概念层次结构提供了理论基础。一个主要目标是{em 可扩展}的概念地图注释或标签化。我们还偶然追求其他目标,比如推导常见的词语组合(双词组和三词组),即词语二元组和三元组。我们使用以下内容来评估我们的方法:(i)一个文本集合,(ii)一个被细分成连续部分的单个文本(我们提供了一个交互式演示),以及(iii)按句子或行级别细分的文本。虽然提供了一个通用框架的详细说明,但我们的工作的一个突出特点是,我们专注于层次结构的{em 局部性},以提取语义信息。

作者:F. Murtagh, J. Mothe and K. Englmeier

论文ID:cs/0701180

分类:Information Retrieval

分类简称:cs.IR

提交时间:2007-05-23

PDF 下载: 英文版 中文版pdf翻译中