多语言自动对话评估的方向

摘要:通过机器翻译来弥补多语言数据的缺乏,并利用机器翻译增加现有的英语对话数据。我们实证地显示,仅用翻译数据对预训练的多语言编码器模型进行微调的朴素方法不足以胜过仅用源数据对多语言模型进行微调的强基准方法。相反,最佳方法是通过使用机器翻译质量估计度量仔细策划翻译数据,排除低质量的翻译对其性能的影响。

作者:John Mendonc{c}a, Alon Lavie, Isabel Trancoso

论文ID:2308.16795

分类:Computation and Language

分类简称:cs.CL

提交时间:2023-09-01

PDF 下载: 英文版 中文版pdf翻译中