关于带反向引用的正则表达式的表达能力
摘要:通过称为反向引用的特性扩展的正则表达式称为rewb。已广泛知道,反向引用是正则表达式的一种实用扩展,并且得到了大多数现代正则表达式引擎的支持,例如Java、Python等标准库中的引擎。同时,索引语言是由索引文法生成的语言,索引文法是由A.V.Aho提出的一种形式文法类别。我们表明这两个模型的表达能力存在如下关系:由rewb描述的每个语言都是索引语言。作为先前已知最小的形式文法类别包括rewbs在内的是上下文有关的语言类别,我们的结果严格改进了已知的上界。此外,我们证明了以下两个命题:存在一个rewb,其语言不属于堆栈语言类别(堆栈语言是索引语言的一个真子类),以及由不带有捕获引用的rewb描述的语言属于非删除堆栈语言类别(非删除堆栈语言是堆栈语言的一个真子类)。最后,我们证明了先前一项研究中探讨的通过嵌套级别的概念将rewbs的表达能力分隔开的层次结构属于非删除堆栈语言类别中。
作者:Taisei Nogami, Tachio Terauchi
论文ID:2307.08531
分类:Formal Languages and Automata Theory
分类简称:cs.FL
提交时间:2023-08-09