文件格式解析的区间解析语法
摘要:文件格式规定了数据如何编码为持久化存储。它们不能被形式化为上下文无关文法,因为它们的规范包含上下文相关模式,如随机访问模式和类型长度值模式。我们提出了一种称为区间解析文法(Interval Parsing Grammars,IPGs)的新的文法机制,用于文件格式规范。IPG将区间附加到每个非终结符/终结符,指定非终结符/终结符消耗的输入范围。通过连接区间和属性,可以很好地处理文件格式中的上下文相关模式。在本文中,我们形式化了IPGs的语法和语义,并且其语义自然地导致了一个解析生成器,可以从IPG生成递归下降解析器。总体而言,IPGs是声明性的、模块化的,并且可以进行终止检查。我们已经使用IPGs来指定了许多文件格式,包括ZIP、ELF、GIF、PE和部分PDF;我们还评估了生成的解析器的性能。
作者:Jialun Zhang, Greg Morrisett, Gang Tan
论文ID:2304.04859
分类:Programming Languages
分类简称:cs.PL
提交时间:2023-04-24