基于嵌入式检索的用于有效农业信息提取的LLM方法

摘要:农业害虫识别在农业害虫控制中至关重要。然而,大多数农民不能准确地在田间识别害虫,并且快速查询的结构化数据源有限。在这项工作中,我们探索使用领域不可知的通用预训练大型语言模型(LLM),以最少或无人为干预的方式从农业文件中提取结构化数据。我们提出了一种方法论,包括使用基于嵌入的检索进行文本检索和过滤,然后使用LLM问答来自动提取文档中的实体和属性,并将它们转化为结构化数据。与现有方法相比,我们的方法在基准测试中始终保持更好的准确性,并保持高效性。

作者:Ruoling Peng, Kang Liu, Po Yang, Zhipeng Yuan, Shunbao Li

论文ID:2308.03107

分类:Artificial Intelligence

分类简称:cs.AI

提交时间:2023-08-08

PDF 下载: 英文版 中文版pdf翻译中