ChatGPT 用于阿拉伯语语法错误纠正-arXiv论文预印本中文版

ChatGPT 用于阿拉伯语语法错误纠正

摘要：大语言模型(LLM)最近被调整以遵循人类指令，在各种英语自然语言处理任务中展现出显著的能力。然而，在语法错误修正(GEC)任务中，尤其是非英语语言中，它们的表现仍然被显著地未开发。在本文中，我们深入研究了指令调整的LLM在阿拉伯语GEC中的能力，这是由于阿拉伯语的丰富形态而变得复杂的任务。我们的研究结果表明，各种提示方法结合(上下文中的)少量训练展示出显著的效果，GPT-4在专家提示下的F1得分高达65.49(比我们已建立的基线高约5个点)。这突显了LLM在低资源环境中的潜力，为模型训练生成有用的合成数据提供了可行的方法。尽管取得了这些积极结果，我们发现指令调整的模型，无论其大小如何，与显著较小的完全调整模型相比，表现显著低下。这种差异突显了LLM的改进空间。受低资源机器翻译方法的启发，我们还开发了一种利用合成数据的方法，在两个标准的阿拉伯语基准测试中显著优于以前的模型。我们的工作在阿拉伯语GEC方面达到了新的最佳结果，分别在2014年和2015年QALB数据集上达到72.19%和73.26%的F1得分。

作者：Sang Yun Kwon, Gagan Bhatia, El Moatez Billah Nagoud, Muhammad Abdul-Mageed

论文ID：2308.04492

分类：Artificial Intelligence

分类简称：cs.AI

提交时间：2023-08-10

PDF 下载： 英文版中文版pdf翻译中