生成型人工智能与数字共同体-arXiv论文预印本中文版

生成型人工智能与数字共同体

摘要：建议为生成式基础模型（GFMs）在公共数据上进行培训，并使用公共基础设施，但是1）可能降低它们依赖的“数字公共空间”的价值，2）没有机制将捕获的价值回馈给数据生产者和利益相关者。现有的数据权益和保护概念（主要关注个人拥有的数据和相关的隐私问题）以及基于版权或许可的模型提供了一些指导，但对于基于公共数据进行培训的模型可能出现的问题并不适用。我们概述了GFMs所带来的风险以及它们与数字公共空间的相关性，并提出了多种基于治理的解决方案，其中包括对生成模型的培训和能力进行标准化数据集/模型披露和其他透明化投资，以及用于监控/标准/审计组织的财团式资助、要求或规范GFMs公司向公众提供高质量数据的要求或规范，以及基于个人或社区提供微调数据的共享所有权结构。

作者：Saffron Huang and Divya Siddarth

论文ID：2303.11074

分类：Computers and Society

分类简称：cs.CY

提交时间：2023-03-21

PDF 下载： 英文版中文版pdf翻译中