×

加速坐标下降法对结构优化问题的效率。 (英语) Zbl 1359.90073号

摘要:在本文中,我们证明了加速坐标下降法的一种变体的一个新的复杂度界[于。内斯特罗夫,SIAM J.Optim。22,第2期,341-362(2012年;Zbl 1257.90073号)]. 我们表明,该方法通常优于标准快速梯度方法(FGM[于。E.内斯特罗夫,苏联。数学。,多克。27, 372–376 (1983); Dokl翻译。阿卡德。Nauk SSSR 269、543–547(1983年;Zbl 0535.90071号); 数学。程序。103,第1(A)号,127-152(2005年;Zbl 1079.90102号)])关于稠密数据的优化问题。在许多重要的情况下,我们的方案每次迭代时,预言机和方法本身的计算开销是完全平衡的(两者都线性地依赖于问题的维数)。作为应用示例,我们考虑了无约束凸二次极小化和平滑技术中出现的问题[Nesterov,2005,loc.cit.]。在一些特殊的问题实例中,关于FGM的可证明加速度因子可以达到变量数的平方根。数值实验证实了我们的理论结论。

MSC公司:

90摄氏度06 数学规划中的大尺度问题
90C25型 凸面编程
90立方厘米 数学规划中的极小极大问题
65年第68季度 算法和问题复杂性分析

软件:

NESUN公司
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Z.Allen-Zhu、Z.Qu、P.Richtaírik和Y.Yuan,{使用非均匀采样实现更快的加速坐标下降},《第33届机器学习国际会议论文集》,2016年,第1110-1119页。
[2] Y.T.Lee和A.Sidford,{求解线性系统的高效加速坐标下降方法和最快算法},FOCS,2013年。
[3] 于。Nesterov,{\it一种具有收敛速度的无约束凸最小化问题的方法(O({1\overk^2})},Dokl。AN SSSR(翻译为《苏联数学博士》),第269页(1983年),第543-547页。
[4] 于。Nesterov,{非光滑函数的平滑最小化},数学。程序。(A) ,103(2005),第127-152页·Zbl 1079.90102号
[5] 于。Nesterov,{坐标下降法在大规模优化问题上的效率},SIAM J.Optim。,22(2012),第341-362页·Zbl 1257.90073号
[6] 于。Nesterov,{凸优化入门讲座,基础课程},Kluwer,波士顿,2004年·Zbl 1086.90045号
[7] 于。Nesterov,{凸优化问题的通用梯度法},数学。程序。(A) ,152(2015),第381-404页·Zbl 1327.90216号
[8] P.Richtarik和M.Takac͂,{大数据优化的平行坐标下降法},数学。程序。,(2012),第1-51页。
[9] P.Richtarik和M.Takac͂,{大数据学习的分布式坐标下降法},J.Machine learning Res.,17(2016),75·Zbl 1360.68709号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。