数据站点:委派、可信和可审计的计算,为数据共享联盟提供数据托管。
摘要:数据的整合和共享增加了数据的价值并分发。然而,一旦数据共享,就无法撤销,对于需要针对监管、隐私和法律原因进行控制释放的情况,默认不共享。由于难以选择性控制释放哪些数据,目前的数据共享协议往往是通过长时间而繁琐的一对一协商建立起来的。我们引入了Data Station,一种旨在促成数据共享协议形成的数据托管机制。数据所有者将数据与Data Station共享,知道只有在其同意下才能发布数据。数据使用者委托计算任务给Data Station。数据托管机制依赖委托计算在数据发布之前执行查询操作。Data Station利用硬件隔离区域来建立参与者之间的信任,并利用数据和计算的集中化生成审计日志。我们在一个不受信任的中间代理运行时评估Data Station的机器学习和数据共享应用。除了重要的定性优势外,我们展示了Data Station具有以下特点:i)在机器学习应用中,其准确度和运行时间优于联邦学习基准;ii)比其他安全数据共享框架快上几个数量级;iii)对关键路径产生的开销较小。
作者:Siyuan Xia, Zhiru Zhu, Chris Zhu, Jinjin Zhao, Kyle Chard, Aaron J. Elmore, Ian Foster, Michael Franklin, Sanjay Krishnan, Raul Castro Fernandez
论文ID:2305.03842
分类:Databases
分类简称:cs.DB
提交时间:2023-05-09