翻译意义,而非单纯的词语:IdiomKB在利用语言模型优化习语翻译中的作用
摘要:机器翻译和通用语言模型需要深入理解源语言和目标语言的文化,才能进行有效的翻译。因此,成语由于其非构成性的特点,对基于Transformer的系统构成了特殊挑战,因为字面翻译通常无法捕捉到预期意义。传统方法使用已有的知识库替换成语,但往往缺乏规模和上下文感知性。为了解决这些挑战,我们的方法优先考虑上下文感知性和可扩展性,采用离线存储的方式将成语存储在可管理的知识库中,以确保在较小的模型上进行高效服务,并提供更全面的对惯用表达的理解。我们介绍了一个使用大型语言模型开发的多语言成语知识库(IdiomKB)来解决这个问题。该知识库通过检索成语的比喻含义,提高了较小模型(如BLOOMZ(7.1B)、Alpaca(7B)和InstructGPT(6.7B))的翻译质量。我们提出了一种基于GPT-4的度量标准,用于人工对齐评估,证明IdiomKB能够显著提升模型性能。人工评估进一步验证了我们知识库的质量。
作者:Shuang Li, Jiangjie Chen, Siyu Yuan, Xinyi Wu, Hao Yang, Shimin Tao, Yanghua Xiao
论文ID:2308.13961
分类:Computation and Language
分类简称:cs.CL
提交时间:2023-08-29