×

通过在线学习实现基于Oracle的稳健优化。 (英语) Zbl 1327.90379号

摘要:稳健优化是一种常见的不确定性优化框架,当问题参数未知时,鲁棒优化是一个常见的优化框架,但已知它们属于某些给定的不确定性集。在鲁棒优化框架中,解决了一个最小-最大问题,其中根据参数最差可能实现的性能来评估解决方案。在许多情况下,直接解决某一类型的稳健优化问题需要解决更复杂类型的优化问题,在某些情况下可能是NP-hard。例如,求解一个鲁棒二次曲线二次规划,例如那些在具有椭球不确定性集的鲁棒支持向量机(SVM)中产生的规划,通常会导致一个半定规划。在本文中,我们开发了一种使用在线凸优化工具近似求解鲁棒优化问题的方法,其中每个阶段都求解一个标准(非鲁棒)优化程序。我们的算法使用对预言机的多次调用找到了一个近似的鲁棒解决方案,该解决方案解决了与目标精度的平方成反比的原始(非鲁棒)问题。

MSC公司:

90立方厘米 数学规划中的极小极大问题
90立方厘米 随机规划

软件:

总质量标准
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Arora S,Hazan E,Kale S(2012)乘法权重更新方法:元算法和应用。理论计算。8(6):121-164交叉参考·Zbl 1283.68414号
[2] Ben-Tal A、Ghaoui LE、Nemirovski A(2009)稳健优化《普林斯顿应用数学丛书》(普林斯顿大学出版社,新泽西州普林斯顿)。交叉参考
[3] Ben-Tal A,Nemirovski A(1998)稳健凸优化。数学。操作。物件。23(4):769-805摘要·Zbl 0977.90052号
[4] Ben-Tal A,Nemirovski A(2002)稳健优化——方法和应用。数学。程序。92(3):453-480.交叉参考·Zbl 1007.90047号
[5] Bertsimas D,Brown DB,Caramanis C(2011)稳健优化理论与应用。SIAM版本。53(3):464-501.交叉参考·兹比尔1233.90259
[6] Bertsimas D,Sim M(2003)稳健离散优化和网络流。数学。程序。98(1-3):49-71.交叉参考·Zbl 1082.90067号
[7] Bhattacharyya C,Grate LR,Jordan MI,El Ghaoui L,Mian IS(2004a)稳健稀疏超平面分类器:应用于不确定分子剖面数据。计算生物学杂志。11(6):1073-1089交叉参考
[8] Bhattacharyya C,Shivaswamy PK,Smola AJ(2004b)用于分类缺失数据的二阶锥规划公式。高级神经信息。处理系统(NIPS)153-160.
[9] Calafiore G,Campi MC(2004)《不确定凸规划:随机解和置信水平》。数学。编程102(1):25-46交叉参考·Zbl 1177.90317号
[10] Cesa Bianchi N,Lugosi G(2006年)预测、学习和游戏(剑桥大学出版社,纽约)。交叉参考·Zbl 1114.91001号
[11] Clarkson KL、Hazan E、Woodruff DP(2012)《机器学习的次线性优化》。美国临床医学杂志59(5):23:1-23:49交叉参考
[12] Garber D,Hazan E(2011)在次线性时间内逼近半定规划。高级神经信息。处理系统(NIPS), 1080-1088.
[13] Hazan E(2014)在线凸优化简介. http://ocobook.cs.princeton.edu/。
[14] Hazan E,Koren T(2014)信赖域问题的线性时间算法。arXiv预打印arXiv:1401.6757·Zbl 1346.90654号
[15] Hazan E、Koren T、Srebro N(2011)《击败SGD:在次线性时间内学习SVM》。高级神经信息。处理系统(NIPS), 1233-1241.
[16] Kalai AT,Vempala S(2005)在线决策问题的高效算法。J.计算。系统。科学。71(3):291-307.交叉参考·Zbl 1094.68112号
[17] Klein P,Young N(1999)关于Dantzig-Wolfe优化和填充覆盖近似算法的迭代次数。Cornuejols G、Burkard RE、Woeginger GJ编辑。程序。第七届国际。IPCO会议。(柏林施普林格),320-327.交叉参考
[18] Lanckriet GR,El Ghaoui L,Bhattacharyya C,Jordan MI(2003)《稳健的极小极大分类法》。J.机器学习。物件。3:555-582. ·Zbl 1084.68657号
[19] MoréJJ,Sorensen DC(1983)计算信赖域步骤。SIAM J.科学。统计师。计算。4(3):553-572.交叉参考·Zbl 0551.65042号
[20] Mutapcic A,Boyd SP(2009),具有悲观预言的鲁棒凸优化的割集方法。最佳方案。方法和软件24(3):381-406交叉参考·兹比尔1173.90502
[21] Nilim A,El Ghaoui L(2005)具有不确定转移矩阵的马尔可夫决策过程的鲁棒控制。操作。物件。53(5):780-798摘要·Zbl 1165.90674号
[22] Plotkin SA、Shmoys DB、Tardosé(1995)分数包装和覆盖问题的快速近似算法。数学。操作。物件。20(2):257-301摘要·Zbl 0837.90103号
[23] Puterman ML(1994)马尔可夫决策过程(John Wiley&Sons,纽约)。交叉参考
[24] Rendl F,Wolkowicz H(1997)信赖域子问题的半定框架及其在大规模最小化中的应用。数学。编程77(1):273-299.交叉参考·Zbl 0888.90137号
[25] Shalev-Shwartz S(2012)在线学习和在线凸优化。已找到。趋势马赫数。学习。4(2):107-194.交叉参考·Zbl 1253.68190号
[26] Shivaswamy PK,Bhattacharyya C,Smola AJ(2006)处理缺失和不确定数据的二阶锥规划方法。J.机器学习。物件。7:1283-1314. ·Zbl 1222.68305号
[27] Tamar A,Mannor S,Xu H(2014)使用函数近似放大稳健MDP。Xing EP,Jebara T编辑。程序。第31届国际。Conf.机器学习。(ICML), 181-189.
[28] Travalis T,Gilbert R(2007)用于分类和计算问题的鲁棒支持向量机。最佳方案。方法软件22(1):187-198交叉参考·Zbl 1116.62070号
[29] Xu H,Caramanis C,Mannor S(2009)支持向量机的稳健性和正则化。J.机器学习。物件。10(7月):1485-1510·Zbl 1235.68209号
[30] Xu H,Caramanis C,Mannor S(2010)稳健回归和Lasso。IEEE传输。通知。理论56(7):3561-3574.交叉参考·Zbl 1366.62147号
[31] Zinkevich M(2003)在线凸规划和广义无穷小梯度上升。Fawcett T,Mishra N,编辑。程序。第20届国际。Conf.机器学习。(ICML)(AAAI出版社,加利福尼亚州帕洛阿尔托),928-936。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。