前向和反向基于梯度的超参数优化

摘要:使用两种方法(反向模式和正向模式)来计算任何迭代学习算法(如随机梯度下降)的超参数与验证误差之间的梯度。这些方法对应于计算循环神经网络梯度的两种方法,并且在运行时间和空间需求方面有不同的权衡。我们对反向模式的形式化与Maclaurin等人[2015]的先前工作相关联,但不需要可逆动力学。正向模式适用于实时超参数更新,可以显著加快在大型数据集上的超参数优化。我们通过数据清理和学习任务交互的实验展示了这些方法,并提供了一个使用以前基于梯度的方法是禁止的大规模实验。

作者:Luca Franceschi, Michele Donini, Paolo Frasconi, Massimiliano Pontil

论文ID:1703.01785

分类:Machine Learning

分类简称:stat.ML

提交时间:2017-12-13

PDF 下载: 英文版 中文版pdf翻译中