扩展与聚类：神经网络的精确参数恢复-arXiv论文预印本中文版

扩展与聚类：神经网络的精确参数恢复

摘要：通过探测人工神经网络（ANN）的输入-输出映射，我们可以恢复隐藏的参数吗？我们提出了一种系统方法，称为“扩展和聚类”，只需要隐藏层数和被探测ANN的激活函数，就可以识别出所有网络参数。在扩展阶段，我们使用被探测的ANN的数据作为教师，训练一系列逐渐增大规模的网络。当给定规模的网络达到一致的最小损失时，扩展停止。在聚类阶段，扩展后的学生网络的权重向量进行聚类，以结构化方式剪枝多余的神经元。我们发现，超参数化的四倍足以可靠地识别出最小的神经元数量，并在难度不同的150个玩具问题的家族中以80％的准确率检索到原始的网络参数。此外，用MNIST数据训练的浅层和深层教师网络的神经元数量可以以小于5％的开销进行识别。因此，尽管由于高度非凸的损失函数，直接以与教师网络相同大小的学生网络进行训练实际上是不可能的，但是使用轻微的超参数化进行训练，然后进行聚类和结构化剪枝可以正确识别目标网络。

作者：Flavio Martinelli, Berfin Simsek, Johanni Brea and Wulfram Gerstner

论文ID：2304.12794

分类：Neural and Evolutionary Computing

分类简称：cs.NE

提交时间：2023-05-31

PDF 下载： 英文版中文版pdf翻译中