正则表达式的补和交集的简洁性

摘要:正则表达式的补集和交集的简洁性研究:构建指定正则表达式的补集时,不能避免双指数级增长;同样地,当构建一个固定数量和任意数量的正则表达式的交集时,最坏情况下,分别不能避免指数和双指数级增长。所有提到的下界都通过一个指数改进了现有的下界,并且在目标表达式可以在相应的时间类(指数或双指数时间)内构造的意义下是紧确的。作为副产品,我们将Ehrenfeucht和Zeiger的一个定理推广到一个固定的四个字母的字母表上,该定理表明,存在一类比正则表达式更加简洁的确定有限自动机(DFA)。当给定的正则表达式是一非二义的,如XML Schema规范所要求的那样,能够在多项式时间内计算补集,而与交集相关的界仍然成立。对于单出现正则表达式的子类,我们证明了交集的紧确指数下界。

作者:Wouter Gelade, Frank Neven

论文ID:0802.2869

分类:Computational Complexity

分类简称:cs.CC

提交时间:2008-02-21

PDF 下载: 英文版 中文版pdf翻译中