从结构化数据中学习覆盖上下文无关文法
摘要:学习未知的上下文无关语法时,我们考虑的问题是,唯一可用和感兴趣于学习者的知识是其最大深度为$ell$的结构描述。目标是学习与$ell$相关的包覆上下文无关语法 (CCFG),即与未知的上下文无关语法的最大深度为$ell$的结构描述一致的上下文无关语法 (CFG)。我们提出了一个名为$LA^ell$的算法,它使用两种类型的查询:结构等价和结构成员。我们证明$LA^ell$的运行时间多项式于相对于$ell$的最小确定有限覆盖树自动机 (DCTA) 的状态数。这个数目通常远小于未知语法的结构描述的最小确定有限树自动机的状态数。
作者:Mircea Marin and Gabriel Istrate
论文ID:1404.2409
分类:Formal Languages and Automata Theory
分类简称:cs.FL
提交时间:2014-04-10