关于最小化Polyak-Lojasiewicz函数下界的研究-arXiv论文预印本中文版

关于最小化Polyak-Lojasiewicz函数下界的研究

摘要：一般情况下，通过使用梯度下降算法，Polyak-Lojasiewicz（PL）条件可以确保全局收敛。本文研究使用一阶序列算法寻找近似最优解的算法的下界。我们证明，对于具有mu-PL常数的一般L-光滑函数，任何一阶算法都需要至少 ${\Omega} \left( \frac{L}{\mu} \log \frac{1}{\varepsilon} \right)$梯度计算才能找到一个$\varepsilon$-近似的最优解。这一结果表明了梯度下降算法在最小化光滑PL函数方面的最优性，即存在一个“困难”的PL函数，当忽略一个数值常数时，没有一阶算法可以比梯度下降更快。相比之下，众所周知的动量方法，比如[Nesterov，2003，第2章]，可以证明加速梯度下降到 ${O} \left( \sqrt{\frac{L}{\hat{\mu}}} \log \frac{1}{\varepsilon} \right)$梯度计算，适用于满足L-光滑和$\hat{\mu}$-强凸性条件的函数。因此，我们的结果区分了最小化光滑PL函数和光滑强凸函数的困难程度，前者的复杂性通常无法通过任何多项式次数改进。

作者：Pengyun Yue, Cong Fang, Zhouchen Lin

论文ID：2212.13551

分类：Optimization and Control

分类简称：math.OC

提交时间：2023-08-03

PDF 下载： 英文版中文版pdf翻译中