DictaBERT:现代希伯来语的最先进BERT套件

摘要:DictaBERT:一个现代希伯来语的新型BERT模型,性能优于现有模型。此外,我们还发布了两个经过微调的模型版本,旨在执行希伯来文本分析中的两项基础任务:前缀分割和形态标记。这些经过微调的模型允许任何开发者通过一次对HuggingFace模型的调用来执行希伯来语句的前缀分割和形态标记,无需集成任何其他库或代码。在本文中,我们描述了训练细节以及在不同基准测试中的结果。我们向社区发布这些模型,并附上演示其使用的示例代码。我们发布这些模型是为了进一步促进希伯来语自然语言处理的研究和开发。

作者:Shaltiel Shmidman, Avi Shmidman, Moshe Koppel

论文ID:2308.16687

分类:Computation and Language

分类简称:cs.CL

提交时间:2023-09-01

PDF 下载: 英文版 中文版pdf翻译中