ChatGPT 用于阿拉伯语语法错误纠正
摘要:大语言模型(LLM)最近被调整以遵循人类指令,在各种英语自然语言处理任务中展现出显著的能力。然而,在语法错误修正(GEC)任务中,尤其是非英语语言中,它们的表现仍然被显著地未开发。在本文中,我们深入研究了指令调整的LLM在阿拉伯语GEC中的能力,这是由于阿拉伯语的丰富形态而变得复杂的任务。我们的研究结果表明,各种提示方法结合(上下文中的)少量训练展示出显著的效果,GPT-4在专家提示下的F1得分高达65.49(比我们已建立的基线高约5个点)。这突显了LLM在低资源环境中的潜力,为模型训练生成有用的合成数据提供了可行的方法。尽管取得了这些积极结果,我们发现指令调整的模型,无论其大小如何,与显著较小的完全调整模型相比,表现显著低下。这种差异突显了LLM的改进空间。受低资源机器翻译方法的启发,我们还开发了一种利用合成数据的方法,在两个标准的阿拉伯语基准测试中显著优于以前的模型。我们的工作在阿拉伯语GEC方面达到了新的最佳结果,分别在2014年和2015年QALB数据集上达到72.19%和73.26%的F1得分。
作者:Sang Yun Kwon, Gagan Bhatia, El Moatez Billah Nagoud, Muhammad Abdul-Mageed
论文ID:2308.04492
分类:Artificial Intelligence
分类简称:cs.AI
提交时间:2023-08-10