从BERT到GPT-3 Codex:利用超大语言模型的潜力进行数据管理
摘要:大型语言模型最近在许多自然语言处理基准测试中取得了最新的进展。最新一代的模型可以应用于各种任务,几乎不需要专门的训练。这项技术为数据管理领域的应用提供了各种机会。 本教程将向参与者介绍语言模型的基本背景,讨论不同的使用语言模型的方法,并概述和简要演示现有的库和API。除了生成自然语言的模型之外,还将考虑能够完成程序代码或从自然语言指令生成代码的模型,如GPT-3 Codex。最后,本教程将讨论数据库领域最近利用语言模型的研究成果,包括在传统数据库系统中使用语言模型或提出基于语言模型的新系统架构。 该教程针对数据库研究人员。不需要先前的语言模型背景知识。该教程的目标是向数据库研究人员介绍最新一代的语言模型及其在数据管理领域的用例。
作者:Immanuel Trummer
论文ID:2306.09339
分类:Databases
分类简称:cs.DB
提交时间:2023-06-16