×

无导数优化中梯度近似的理论和经验比较。 (英语) Zbl 1493.90233号

小结:在本文中,我们分析了几种仅使用函数值逼近带噪函数梯度的方法。这些方法包括有限差分、线性插值、高斯平滑和球面平滑。这些方法在采样函数的数量、采样点的选择以及梯度近似的推导方式上有所不同。对于每种方法,我们都推导了样本数和采样半径的界,这保证了线性搜索或固定步长下降方法的良好收敛性。为此,我们在[A.S.贝拉哈斯等,SIAM J.Optim。第2期第31页,1489–1518(2021年;Zbl 1470.90129号)]并展示了每种方法如何满足充分条件,可能只是在每次迭代时具有足够大的概率,就像球面上的高斯平滑和平滑一样。最后,我们给出了评估梯度近似的质量及其性能的数值结果,并结合线搜索无导数优化算法。

MSC公司:

90 C56 无导数方法和使用广义导数的方法
90立方 非线性规划
65千5 数值数学规划方法
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 瑟伦·阿斯穆森(Sören Asmussen)和彼得·W·格林(Peter W.Glynn)。随机模拟-算法与分析,《随机建模与应用概率》第57卷。施普林格,2007年·Zbl 1126.65001号
[2] 阿方索·班德拉(Afonso Bandeira)、卡蒂亚·申伯格(Katya Scheinberg)和路易斯·维森特(Luis N Vicente)。稀疏低阶插值多项式的计算及其在无导数优化中的应用。数学编程,B辑,134:223-2572012·Zbl 1254.65072号
[3] 阿纳斯塔西娅·巴彦蒂娜、亚历山大·加斯尼科夫、法里曼·古利耶夫和阿纳斯塔西亚·拉古诺夫斯卡娅。具有附加小噪声的非光滑随机凸优化问题的无梯度两点优化方法。arXiv-printarXiv:1701.038212017年。
[4] 阿尔伯特·贝拉哈斯(Albert S Berahas)、理查德·伯德(Richard H Byrd)和豪尔赫·诺塞达尔(Jorge Nocedal)。用拟牛顿法对含噪函数进行无导数优化。SIAM优化杂志,29(2):965-9932019年·Zbl 1411.90359号
[5] Albert S Berahas,Liyuan Cao和Katya Scheinberg。带噪声的通用直线搜索算法的全局收敛速度分析。arXiv-printarXiv:1910.040552019年。
[6] 列夫·波哥卢布斯基(Lev Bogolubsky)、帕维尔·德武列岑斯基(Pavel Dvurechenskii)、亚历山大·加斯尼科夫(Alexander Gasnikov)、格列布·古塞夫(Gleb Gusev)、尤里·内斯特罗夫(Yurii Nesterov)、安德烈·梅里戈罗德斯基(Andrei M Raigorodskii)、。使用基于梯度和无梯度的优化方法学习有监督的pagerank。神经信息处理系统进展,29:4914-49222016。
[7] Raghu Bollapragada和Stefan M Wild。无导数随机优化的自适应采样拟牛顿方法。arXiv-printarXiv:1910.135162019年。
[8] 理查德·布伦特。无导数最小化算法。Courier Corporation,2013年。
[9] Greg Brockman、Vicki Cheung、Ludwig Pettersson、Jonas Schneider、John Schulman、Jie Tang和Wojciech Zaremba。OpenAI健身房。arXiv预输入rXiv:1606.0154016。
[10] Richard H Byrd、Gillian M Chin、Jorge Nocedal和Yuchen Wu。机器学习优化方法中的样本量选择。数学规划,134(1):127-1552012·Zbl 1252.49044号
[11] 理查德·卡特。使用不精确梯度信息的信赖域算法的全局收敛性。SIAM数值分析杂志,28(1):251-2651991·Zbl 0725.65063号
[12] Coralia Cartis和Katya Scheinberg。基于概率模型的无约束优化方法的全局收敛速度分析。数学规划,第1-39页,2018年。
[13] Krzysztof Choromanski、Atil Ischen、Vikas Sindhwani、Jie Tan和Erwin Coumans。使用容错结构化探索优化仿真。2018年IEEE机器人与自动化国际会议(ICRA),第2970-2977页。IEEE,2018年。
[14] Krzysztof Choromanski、Mark Rowland、Vikas Sindhwani、Richard E Turner和Adrian Weller。采用紧凑的体系结构进行结构化进化,以实现可扩展的策略优化。arXiv-printarXiv:1804.023952018年。
[15] Andrew R Conn、Katya Scheinberg和Philippe L Toint。关于无约束优化无导数方法的收敛性。在A.Iserles和M.Buhmann,编辑,《近似理论与优化:向M.J.D.Powell致敬》,第83-108页,英国剑桥,1997年。剑桥大学出版社·Zbl 1042.90617号
[16] Andrew R Conn、Katya Scheinberg和Philippe L Toint。一种实用的无导数优化算法。1998年9月2日至4日在密苏里州圣路易斯举行的第七届美国国际航空航天局/美国空军/美国国家航空航天局/ISSMO多学科分析与优化研讨会论文集·兹比尔1042.90617
[17] Andrew R Conn、Katya Scheinberg和Luis N Vicente。无导数优化中的插值集几何。数学规划,111(1-2):141-1722008·Zbl 1163.90022号
[18] Andrew R Conn、Katya Scheinberg和Luis N Vicente。无导数优化简介。MPS-SIAM优化系列。SIAM,美国费城,2008年·Zbl 1157.65034号
[19] 伊丽莎白·多兰(Elizabeth D Dolan)和豪尔赫·莫雷(Jorge J Moré)。使用性能配置文件对优化软件进行基准测试。数学规划,91(2):201-2132002·邮编:1049.90004
[20] 约翰·杜奇(John C Duchi)、迈克尔·乔丹(Michael I Jordan)、马丁·温赖特(Martin J Wainwright)和安德烈·维比索诺(Andre Wibisono)。零阶凸优化的最优速率:两个函数求值的幂。IEEE信息理论汇刊,61(5):2788-28062015·Zbl 1359.90155号
[21] Pavel Dvurechensky、Eduard Gorbunov和Alexander Gasnikov。光滑随机凸优化的加速方向导数方法。《欧洲运筹学杂志》,2020年·Zbl 1487.90524号
[22] 玛丽亚姆·法泽尔(Maryam Fazel)、荣格(Rong Ge)、沙姆·卡卡德(Sham M Kakade)和梅兰·梅斯巴希(Mehran Mesbahi)。线性二次调节器策略梯度方法的全局收敛性。arXiv-printarXiv:1801.050392018年。
[23] 亚伯拉罕·弗拉克斯曼(Abraham D Flaxman)、亚当·托曼·卡莱(Adam Tauman Kalai)和H Brendan McMahan。土匪设置中的在线凸优化:无梯度的梯度下降。第十六届ACM-SIAM离散算法研讨会论文集,第385-394页。工业和应用数学学会,2005年·Zbl 1297.90117号
[24] 赛义德·加迪米;Lan,Guanghui,非凸随机规划的随机一阶和零阶方法,SIAM优化杂志,23,4,2341-2368(2013)·Zbl 1295.90026号 ·数字对象标识代码:10.1137/120880811
[25] Kevin G Jamieson、Robert Nowak和Ben Recht。无导数优化的查询复杂性。《神经信息处理系统进展》,25:2762-2680,2012。
[26] 杰克·基弗和雅各布·沃尔福威茨。回归函数最大值的随机估计。《数理统计年鉴》,23(3):462-4661952·兹比尔0049.36601
[27] 杰弗里·拉尔森(Jeffrey Larson)、马特·梅尼凯利(Matt Menickelly)和斯特凡·怀尔德(Stefan M Wild)。无导数优化方法。《数字学报》,2019年28:287-404·Zbl 1461.65169号
[28] 刘思嘉(Sijia Liu)、巴维亚·凯尔库拉(Bhavya Kailkhura)、陈品玉(Pin-Yu Chen)、丁佩顺(Paisun Ting)、张世玉(Shiyu Chang)和丽莎·阿米尼(Lisa Amini)。非凸优化的零阶随机方差约简。《神经信息处理系统进展》,第3727-37372018页。
[29] 阿尔瓦罗·马吉亚(Alvaro Maggiar)、安德烈亚斯·瓦赫特(Andreas Wächter)、伊琳娜·多林斯卡娅(Irina S Dolinskaya)和杰里米·斯塔姆(Jeremy Staum)。一种无导数信任域算法,用于优化使用自适应多重重要性采样的高斯卷积平滑的函数。SIAM优化杂志,28(2):1478-15072018·Zbl 1390.90410号
[30] Jorge J Moré和Stefan M Wild。基准测试无导数优化算法。SIAM优化杂志,20(1):172-1912009·Zbl 1187.90319号
[31] Jorge J Moré和Stefan M Wild。估算计算噪声。SIAM科学计算杂志,33(3):1292-13142011年·Zbl 1243.65016号
[32] 尤里·内斯特罗夫;斯波科尼,弗拉基米尔,凸函数的随机无梯度最小化,计算数学基础,17,2,527-566(2017)·Zbl 1380.90220号 ·doi:10.1007/s10208-015-9296-2
[33] 豪尔赫·诺塞达尔(Jorge Nocedal)和斯蒂芬·赖特(Stephen J Wright)。数值优化,第二版。斯普林格,2006年·Zbl 1104.65059号
[34] 考特尼·帕奎特;Scheinberg,Katya,具有预期复杂性分析的随机线搜索方法,SIAM优化杂志,30,1,349-376(2020)·兹比尔1431.90153 ·doi:10.1137/18M1216250
[35] Raghu Pasupathy、Peter Glynn、Soumyadip Ghosh和Fatemeh S Hashemi。关于基于模拟的递归中的采样率。SIAM优化杂志,28(1):45-732018·Zbl 1380.93168号
[36] 瓦伦丁五世·彼得罗夫。关于尾部概率的下限。统计规划与推断杂志,137(8):2703-27052007·Zbl 1120.60016号
[37] 鲍里斯·波利亚克。优化导论(1987)。优化软件公司,纽约·Zbl 0625.62093号
[38] Powell,Michael J.D.,《不计算导数的无约束最小化算法》,Bollettino delle Unione Matematica Italiana,9,60-69(1974)·兹伯利0324.65030
[39] 迈克尔·J·D·鲍威尔。NEWUOA软件用于无导数的无约束优化。《大尺度非线性优化》,第83卷,第255-297页。美国施普林格,2006年·Zbl 1108.90005号
[40] Mark Rowland、Krzysztof Choromanski、François Chalus、Aldo Pacchiano、Tamas Sarlós、Turner Richard E和Adrian Weller。几何耦合蒙特卡罗采样。《神经信息处理系统进展》,第195-205页,2018年。
[41] Tim Salimans、Jonathan Ho、Xi Chen、Szymon Sidor和Ilya Sutskever。进化策略作为强化学习的可扩展替代方案。技术报告arXiv:1703.038642016。
[42] 克劳斯·席特科夫斯基(Klaus Schittkowski)。非线性编程代码的更多测试示例,第282卷。施普林格科学与商业媒体,2012年·Zbl 0658.90060号
[43] 约翰·舒尔曼(John Schulman)、谢尔盖·莱文(Sergey Levine)、彼得·阿比尔(Pieter Abbeel)、迈克尔·乔丹(Michael Jordan)和菲利普·莫里茨(Philipp Moritz)。信托区域政策优化。在机器学习国际会议上,第1889-1897页,2015年。
[44] Shamir,Ohad,带两点反馈的土匪和零阶凸优化的优化算法,机器学习研究杂志,18,1,1703-1713(2017)·Zbl 1440.90049号
[45] Sara Shashaani、Fatemeh S Hashemi和Raghu Pasupathy。Astro-df:一类用于无导数随机优化的自适应采样信赖域算法。SIAM优化杂志,28(4):3145-31762018·Zbl 1403.90541号
[46] 詹姆斯·斯波尔。同时摄动法的自适应随机逼近。IEEE自动控制事务,45(10):1839-18532000·Zbl 0990.93125号
[47] 詹姆斯·斯波尔。随机搜索和优化导论:估计、模拟和控制,第65卷。John Wiley&Sons,2005年·邮编1088.90002
[48] 尼尔斯·特里普兰尼、米切尔·斯特恩、奇金、杰弗里·里吉尔和迈克尔·乔丹。快速非凸优化的随机立方正则化。《神经信息处理系统进展》,第2899-2908页,2018年。
[49] 乔尔·特罗普(Joel A Tropp)。矩阵集中不等式简介。arXiv预输入rXiv:1501.015712015·Zbl 1391.15071号
[50] Daan Wierstra;Tom Schaul;托拜厄斯·格拉斯马赫;孙怡;彼得斯,简;Schmidhuber,Jürgen,《自然进化策略》,《机器学习研究杂志》,第15期,第1949-980页(2014年)·Zbl 1318.68159号
[51] Stefan M Wild、Rommel G Regis和Christine A鞋匠。ORBIT:通过信任区域中的径向基函数插值进行优化。SIAM科学计算期刊,30(6):3197-32192008·Zbl 1178.65065号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。