| 中文标题 | 作者 | 论文ID | 分类简称 | 发布时间 |
|---|---|---|---|---|
| SpikeBERT:一种通过BERT的两阶段知识蒸馏训练的语言Spikformer | Changze Lv, Tianlong Li, Jianhan Xu, Chenxi Gu, Zixuan Ling, Cenyuan Zhang, Xiaoqing Zheng, Xuanjing Huang | 2308.15122 | cs.CL | 2023-08-31 |
| 大型语言模型中实体级记忆的量化和分析 | Zhenhong Zhou, Jiuyang Xiang, Chaomeng Chen, Sen Su | 2308.15727 | cs.CL | 2023-08-31 |
| 低资源语言和方言的网络欺凌检测:现有技术综述 | Tanjim Mahmud, Michal Ptaszynski, Juuso Eronen and Fumito Masui | 2308.15745 | cs.CL | 2023-08-31 |
| 基于任务的多任务多语言机器翻译的MoE方法 | Hai Pham, Young Jin Kim, Subhabrata Mukherjee, David P. Woodruff, Barnabas Poczos, Hany Hassan Awadalla | 2308.15772 | cs.CL | 2023-08-31 |
| 吉尔吉斯语中的多标签主题分类基准测试 | Anton Alekseev, Sergey I. Nikolenko, Gulnara Kabaeva | 2308.15952 | cs.CL | 2023-08-31 |
| MerA:合并预训练适配器以进行少样本学习 | Shwai He, Run-Ze Fan, Liang Ding, Li Shen, Tianyi Zhou, Dacheng Tao | 2308.15982 | cs.CL | 2023-08-31 |
| 基于深度卷积神经网络的波斯语评论方面和极性分类的多任务集成模型 | Milad Vazan, Fatemeh Sadat Masoumi, Sepideh Saeedi Majd | 2201.06313 | cs.CL | 2023-08-30 |
| 模型预测的非对称特征交互解释 | Xiaolei Lu, Jianghong Ma, Haode Zhang | 2305.07224 | cs.CL | 2023-08-30 |
| 大型语言模型中的公平之旅:偏见与去偏 | Leonardo Ranaldi, Elena Sofia Ruzzetti, Davide Venditti, Dario Onorati, Fabio Massimo Zanzotto | 2305.13862 | cs.CL | 2023-08-30 |
| 揭示职业领域中的性别偏见:分析和应对社会学意义 | Vishesh Thakur | 2307.09162 | cs.CL | 2023-08-30 |
| 中古高地德语的跨语言短语结构分析:一种去词法化方法 | Ercong Nie, Helmut Schmid, Hinrich Sch"utze | 2308.04645 | cs.CL | 2023-08-30 |
| 基于GPT-3的医疗对话代理面临的挑战 | Fabian Lechner and Allison Lahnala and Charles Welch and Lucie Flek | 2308.14641 | cs.CL | 2023-08-30 |
| 内存-VQ:适用于可处理的互联网规模内存的压缩 | Yury Zemlyanskiy, Michiel de Jong, Luke Vilnis, Santiago Onta~n''on, William W. Cohen, Sumit Sanghai, Joshua Ainslie | 2308.14903 | cs.CL | 2023-08-30 |
| TransPrompt v2: 跨任务文本分类的可迁移提示框架 | Jianing Wang, Chengyu Wang, Cen Chen, Ming Gao, Jun Huang, Aoying Zhou | 2308.15010 | cs.CL | 2023-08-30 |
| 大型语言模型在棋盘上:对ChatGPT的形式化语言理解和复杂推理能力的研究 | Mu-Tien Kuo, Chih-Chung Hsueh, Richard Tzong-Han Tsai | 2308.15118 | cs.CL | 2023-08-30 |
| 事实检查解释生成的基准测试 | Daniel Russo, Serra Sinem Tekiroglu, Marco Guerini | 2308.15202 | cs.CL | 2023-08-30 |
| 针对神经机器翻译的分类引导攻击方法 | Sahar Sadrizadeh, Ljiljana Dolamic, Pascal Frossard | 2308.15246 | cs.CL | 2023-08-30 |
| TaskLAMA:探究语言模型对复杂任务理解的能力 | Quan Yuan, Mehran Kazemi, Xin Xu, Isaac Noble, Vaiva Imbrasaite, Deepak Ramachandran | 2308.15299 | cs.CL | 2023-08-30 |
| 重新思考机器伦理--LLM能否通过道德理论的视角进行道德推理? | Jingyan Zhou, Minda Hu, Junan Li, Xiaoying Zhang, Xixin Wu, Irwin King, Helen Meng | 2308.15399 | cs.CL | 2023-08-30 |
| 语言模型预训练期间学习曲线的特征:学习、遗忘和稳定 | Tyler A. Chang, Zhuowen Tu, Benjamin K. Bergen | 2308.15419 | cs.CL | 2023-08-30 |
| 孟加拉语的吉大港方言中的粗俗言论检测 | Tanjim Mahmud, Michal Ptaszynski, Fumito Masui | 2308.15448 | cs.CL | 2023-08-30 |
| 轮廓为基础的参数化和叠加语调风格化的CoPaSul手册 | Uwe D. Reichel | 1612.04765 | cs.CL | 2023-08-29 |
| 通过候选重新排序增强神经对话模型中的自我披露 | Mayank Soni, Benjamin Cowan, Vincent Wade | 2109.05090 | cs.CL | 2023-08-29 |
| 使用GPT-3增强数据改进短文本分类 | Salvador Balkus and Donghui Yan | 2205.10981 | cs.CL | 2023-08-29 |
| 参数高效的鲁棒持续多语言学习 | Kartikeya Badola, Shachi Dave, Partha Talukdar | 2209.06767 | cs.CL | 2023-08-29 |