Form-NLU: 表单自然语言理解数据集

摘要:首次引入了Form-NLU,一个用于理解表单结构及其键和值信息提取的新颖数据集,解释了表单设计者的意图和用户编写的值与之间的对齐关系。该数据集包含857个表单图像,6k个表单键和值,和4k个表格键和值。数据集还包括三种表单类型:数字化、打印和手写,涵盖了多样化的表单外观和布局。提出了一种强韧的基于位置和逻辑关系的表单键值信息提取框架。利用该数据集,首先对表单布局理解进行了强大的目标检测模型验证,然后在数据集上评估了键信息提取任务,为不同类型的表单和键提供了细致的结果。此外,还使用现成的PDF布局提取工具对其进行了验证,并证明了在实际案例中的可行性。

作者:Yihao Ding, Siqu Long, Jiabin Huang, Kaixuan Ren, Xingxiang Luo, Hyunsuk Chung, Soyeon Caren Han

论文ID:2304.01577

分类:Information Retrieval

分类简称:cs.IR

提交时间:2023-08-04

PDF 下载: 英文版 中文版pdf翻译中