稀疏正则表达式匹配
摘要:正则表达式匹配的复杂性:考虑到最坏情况下,匹配一个正则表达式需要$O(nm)$的时间,其中$n$为字符串$Q$的长度,$m$为正则表达式$R$的长度。然而,这个界限被认为是最优的,因为没有已知的方法可以在多项式对数时间内改进。本文采用全新的方法并引入了一种密度参数$Delta$,该参数捕捉到NFA模拟中的非确定性的数量。我们的主要结果是一个新算法,它可以在$O(Delta log log frac{nm}{Delta} +n + m)$的时间内解决正则表达式匹配问题。我们的结果补充了一个条件下界,证明了在假设SETH的前提下,我们无法以$O(Delta^{1-epsilon})$的时间来解决正则表达式匹配问题,其中$epsilon$是任意常数。
作者:Philip Bille and Inge Li G{o}rtz
论文ID:1907.04752
分类:Data Structures and Algorithms
分类简称:cs.DS
提交时间:2023-07-17