用上下文专家解决低资源语言中的仇恨言论-arXiv论文预印本中文版

用上下文专家解决低资源语言中的仇恨言论

摘要：缅甸的历史和社会政治背景导致社交媒体上的仇恨言论蔓延到线下引发了不安和暴力。本文介绍了我们关于在缅甸在线上自动检测仇恨言论的远程研究的发现。我们认为，有效解决这个问题需要结合背景专家的知识和能够分析产生的大量数据的机器学习工具的基于社区的方法。为此，我们开发了一个系统化的过程来促进这种合作，涵盖数据收集、注释和模型验证策略的关键方面。我们强调了这一领域的挑战，包括来自小型和不平衡数据集的问题，平衡非光鲜的数据工作和利益相关者的优先事项，以及封闭的数据共享实践。基于这些发现，我们讨论了进一步研发和部署针对资源贫乏语言的仇恨言论检测系统的途径。

作者：Daniel Nkemelu, Harshil Shah, Irfan Essa, Michael L. Best

论文ID：2303.16828

分类：Computers and Society

分类简称：cs.CY

提交时间：2023-03-30

PDF 下载： 英文版中文版pdf翻译中