生成型人工智能与数字共同体
摘要:建议为生成式基础模型(GFMs)在公共数据上进行培训,并使用公共基础设施,但是1)可能降低它们依赖的“数字公共空间”的价值,2)没有机制将捕获的价值回馈给数据生产者和利益相关者。现有的数据权益和保护概念(主要关注个人拥有的数据和相关的隐私问题)以及基于版权或许可的模型提供了一些指导,但对于基于公共数据进行培训的模型可能出现的问题并不适用。我们概述了GFMs所带来的风险以及它们与数字公共空间的相关性,并提出了多种基于治理的解决方案,其中包括对生成模型的培训和能力进行标准化数据集/模型披露和其他透明化投资,以及用于监控/标准/审计组织的财团式资助、要求或规范GFMs公司向公众提供高质量数据的要求或规范,以及基于个人或社区提供微调数据的共享所有权结构。
作者:Saffron Huang and Divya Siddarth
论文ID:2303.11074
分类:Computers and Society
分类简称:cs.CY
提交时间:2023-03-21