书面文本中的概念网络

摘要:使用复杂网络理论研究个体作者书面文本中有意义概念的结构。经过两个阶段的过滤之后,构建了网络,将含义较少的单词删除,并将剩余的所有单词设置为它们的规范形式,没有任何数值、性别或时间弯曲。将文本中的每个句子作为一个完全图添加到网络中。对大量书面文本进行了详细研究,发现这些文本具有小世界和无标度结构。还研究了这些网络的增长过程,并在不同作者撰写的一组文本中发现了网络定量指标的普遍演化。进一步的分析,基于对文本或构建的网络进行的洗牌程序,提供了有关词频和句子长度分布对网络结构的作用的线索。由于有意义的词汇与作者心中的概念有关,因此文本网络的结果可能揭示出在思维中发生的沟通和语言过程的模式。

作者:Silvia M. G. Caldeira, Thierry C. Petit Lobao, R. F. S. Andrade, Alexis Neme and J. G. V. Miranda

论文ID:physics/0508066

分类:Data Analysis, Statistics and Probability

分类简称:physics.data-an

提交时间:2009-11-11

PDF 下载: 英文版 中文版pdf翻译中