前向和反向基于梯度的超参数优化-arXiv论文预印本中文版

前向和反向基于梯度的超参数优化

摘要：使用两种方法（反向模式和正向模式）来计算任何迭代学习算法（如随机梯度下降）的超参数与验证误差之间的梯度。这些方法对应于计算循环神经网络梯度的两种方法，并且在运行时间和空间需求方面有不同的权衡。我们对反向模式的形式化与Maclaurin等人[2015]的先前工作相关联，但不需要可逆动力学。正向模式适用于实时超参数更新，可以显著加快在大型数据集上的超参数优化。我们通过数据清理和学习任务交互的实验展示了这些方法，并提供了一个使用以前基于梯度的方法是禁止的大规模实验。

作者：Luca Franceschi, Michele Donini, Paolo Frasconi, Massimiliano Pontil

论文ID：1703.01785

分类：Machine Learning

分类简称：stat.ML

提交时间：2017-12-13

PDF 下载： 英文版中文版pdf翻译中