稳定偏见:分析扩散模型中的社会表达

摘要:机器学习驱动的文本到图像系统(TTI)正在变得越来越普遍,并且作为商业服务得到日益采用,在降低其歧视性结果风险方面,对其展示的社会偏见进行表征是必要的第一步。然而,由于这些系统输出的是合成的图像,使得评估变得更加困难;由于虚构人物的人工描绘没有固有的性别或种族,也不属于社会构建的群体,因此我们需要超越常见的多样性或代表性分类。为了解决这个需求,我们提出了一种新方法,通过直接比较展示系统在社会属性(性别和种族)和偏见评估目标属性(职业和与性别相关的形容词)上的变化的生成图像集合,来探索和量化TTI系统中的社会偏见。我们的方法允许我们通过可视化工具来识别具体的偏见趋势,提供有针对性的分数来直接比较模型的多样性和代表性,并联合建模相互依赖的社会变量以支持多维分析。我们使用这种方法来分析由3个流行的TTI系统(DALL-E 2,Stable Diffusion v1.4和v2)生成的超过96,000张图像,并发现这三个系统在目标属性上显著过多地代表了与白人和男性相关联的潜在空间部分;在研究的系统中,DALL-E 2表现出最少的多样性,其次是Stable Diffusion v2然后是v1.4。

作者:Alexandra Sasha Luccioni, Christopher Akiki, Margaret Mitchell, Yacine Jernite

论文ID:2303.11408

分类:Computers and Society

分类简称:cs.CY

提交时间:2023-03-22

PDF 下载: 英文版 中文版pdf翻译中