加载中 . . .
中文标题 作者 论文ID 分类简称 发布时间
SpikeBERT:一种通过BERT的两阶段知识蒸馏训练的语言Spikformer Changze Lv, Tianlong Li, Jianhan Xu, Chenxi Gu, Zixuan Ling, Cenyuan Zhang, Xiaoqing Zheng, Xuanjing Huang 2308.15122 cs.CL 2023-08-31
大型语言模型中实体级记忆的量化和分析 Zhenhong Zhou, Jiuyang Xiang, Chaomeng Chen, Sen Su 2308.15727 cs.CL 2023-08-31
低资源语言和方言的网络欺凌检测:现有技术综述 Tanjim Mahmud, Michal Ptaszynski, Juuso Eronen and Fumito Masui 2308.15745 cs.CL 2023-08-31
基于任务的多任务多语言机器翻译的MoE方法 Hai Pham, Young Jin Kim, Subhabrata Mukherjee, David P. Woodruff, Barnabas Poczos, Hany Hassan Awadalla 2308.15772 cs.CL 2023-08-31
吉尔吉斯语中的多标签主题分类基准测试 Anton Alekseev, Sergey I. Nikolenko, Gulnara Kabaeva 2308.15952 cs.CL 2023-08-31
MerA:合并预训练适配器以进行少样本学习 Shwai He, Run-Ze Fan, Liang Ding, Li Shen, Tianyi Zhou, Dacheng Tao 2308.15982 cs.CL 2023-08-31
基于深度卷积神经网络的波斯语评论方面和极性分类的多任务集成模型 Milad Vazan, Fatemeh Sadat Masoumi, Sepideh Saeedi Majd 2201.06313 cs.CL 2023-08-30
模型预测的非对称特征交互解释 Xiaolei Lu, Jianghong Ma, Haode Zhang 2305.07224 cs.CL 2023-08-30
大型语言模型中的公平之旅:偏见与去偏 Leonardo Ranaldi, Elena Sofia Ruzzetti, Davide Venditti, Dario Onorati, Fabio Massimo Zanzotto 2305.13862 cs.CL 2023-08-30
揭示职业领域中的性别偏见:分析和应对社会学意义 Vishesh Thakur 2307.09162 cs.CL 2023-08-30
中古高地德语的跨语言短语结构分析:一种去词法化方法 Ercong Nie, Helmut Schmid, Hinrich Sch"utze 2308.04645 cs.CL 2023-08-30
基于GPT-3的医疗对话代理面临的挑战 Fabian Lechner and Allison Lahnala and Charles Welch and Lucie Flek 2308.14641 cs.CL 2023-08-30
内存-VQ:适用于可处理的互联网规模内存的压缩 Yury Zemlyanskiy, Michiel de Jong, Luke Vilnis, Santiago Onta~n''on, William W. Cohen, Sumit Sanghai, Joshua Ainslie 2308.14903 cs.CL 2023-08-30
TransPrompt v2: 跨任务文本分类的可迁移提示框架 Jianing Wang, Chengyu Wang, Cen Chen, Ming Gao, Jun Huang, Aoying Zhou 2308.15010 cs.CL 2023-08-30
大型语言模型在棋盘上:对ChatGPT的形式化语言理解和复杂推理能力的研究 Mu-Tien Kuo, Chih-Chung Hsueh, Richard Tzong-Han Tsai 2308.15118 cs.CL 2023-08-30
事实检查解释生成的基准测试 Daniel Russo, Serra Sinem Tekiroglu, Marco Guerini 2308.15202 cs.CL 2023-08-30
针对神经机器翻译的分类引导攻击方法 Sahar Sadrizadeh, Ljiljana Dolamic, Pascal Frossard 2308.15246 cs.CL 2023-08-30
TaskLAMA:探究语言模型对复杂任务理解的能力 Quan Yuan, Mehran Kazemi, Xin Xu, Isaac Noble, Vaiva Imbrasaite, Deepak Ramachandran 2308.15299 cs.CL 2023-08-30
重新思考机器伦理--LLM能否通过道德理论的视角进行道德推理? Jingyan Zhou, Minda Hu, Junan Li, Xiaoying Zhang, Xixin Wu, Irwin King, Helen Meng 2308.15399 cs.CL 2023-08-30
语言模型预训练期间学习曲线的特征:学习、遗忘和稳定 Tyler A. Chang, Zhuowen Tu, Benjamin K. Bergen 2308.15419 cs.CL 2023-08-30
孟加拉语的吉大港方言中的粗俗言论检测 Tanjim Mahmud, Michal Ptaszynski, Fumito Masui 2308.15448 cs.CL 2023-08-30
轮廓为基础的参数化和叠加语调风格化的CoPaSul手册 Uwe D. Reichel 1612.04765 cs.CL 2023-08-29
通过候选重新排序增强神经对话模型中的自我披露 Mayank Soni, Benjamin Cowan, Vincent Wade 2109.05090 cs.CL 2023-08-29
使用GPT-3增强数据改进短文本分类 Salvador Balkus and Donghui Yan 2205.10981 cs.CL 2023-08-29
参数高效的鲁棒持续多语言学习 Kartikeya Badola, Shachi Dave, Partha Talukdar 2209.06767 cs.CL 2023-08-29