字符串变换的常规组合子
摘要:形式语言和自动机理论的一个关键问题是正则算子(如并、连接和克林闭包)是否存在于给定的函数类中。我们将关注将输入字符串映射到半群(例如具有加法的整数集合和具有连接运算的输出字符串集合)的(部分)函数。已经使用双向有限状态转换器、(单向)成本寄存器自动机和可由MSO定义的图形变换来定义了这类函数的正则性概念。在本文中,我们给出了一种类似于通过正则表达式定义正则语言的代数和独立于机器的这一类的特征描述。当半群是可交换的时,我们证明每个正则函数都可以使用选择、分割和迭代求和这些组合子来构造,这些组合子分别是联合、连接和克林闭包的类比,并且强制进行唯一(或无歧义)的解析。我们的主要结果是针对非交换半群的一般情况,这对于捕捉用于文档处理的正则字符串转换尤为重要。我们证明以下额外的组合子就足以构造所有的正则函数:(1)具有左可加性的分割和迭代求和,允许进行字符串反转等转换;(2)函数的求和,允许进行字符串的复制等转换;以及(3)函数的组合,或者另外一个称为连锁求和的新概念,允许混合相邻块的输出值。
作者:Rajeev Alur, Adam Freilich, Mukund Raghothaman
论文ID:1402.3021
分类:Formal Languages and Automata Theory
分类简称:cs.FL
提交时间:2014-02-14