使用话语链进行安全对齐的大型语言模型红队测试-arXiv论文预印本中文版

使用话语链进行安全对齐的大型语言模型红队测试

摘要：呼叫心灵的道: 对于基于大规模语言模型（LLMs）的危害评估标准的提出

作者：Rishabh Bhardwaj, Soujanya Poria

论文ID：2308.09662

分类：Computation and Language

分类简称：cs.CL

提交时间：2023-08-31

PDF 下载： 英文版中文版pdf翻译中