使用话语链进行安全对齐的大型语言模型红队测试

摘要:呼叫心灵的道: 对于基于大规模语言模型(LLMs)的危害评估标准的提出

作者:Rishabh Bhardwaj, Soujanya Poria

论文ID:2308.09662

分类:Computation and Language

分类简称:cs.CL

提交时间:2023-08-31

PDF 下载: 英文版 中文版pdf翻译中