×

为处理强Pareto策略方法的多目标马尔可夫链构造Pareto前沿。 (英语) Zbl 1393.90107号

摘要:本文针对一类离散时间遍历可控马尔可夫链,给出了Pareto前沿的多目标解。为了解决这个问题,我们将原来的多目标问题转化为一个等价的非线性规划问题,实现了拉格朗日原理。然后,我们建议采用Tikhonov正则化方法,以确保成本函数收敛到Pareto前沿的唯一点。我们证明了帕累托策略的特征是最优策略。与帕累托阵线建设相关的一个基本问题是,帕累托政策和强有力的帕累托策略两者的存在和特征。通过引入蒂霍诺夫正则化子,我们确保了强大的帕累托政策的存在。本文针对这一问题提出了一个切实可行的解决方案。我们在考虑几个约束条件的情况下制定了原始问题:(a)我们使用(c)-变量方法在非线性问题上引入线性约束;(b)限制成本函数,允许Pareto前沿的点彼此之间有一个较小的距离。变量方法施加的约束使问题在计算上易于处理,而小距离变化施加的约束确保了帕累托锋的延续。在这个非线性系统中得到的方程是一个优化问题,其中最小值的必要和有效条件是用投影梯度法求解的。此外,我们还分别证明了拉格朗日原理和Tikhonov正则化的收敛条件,并计算了相应变量的估计收敛速度。我们提供了以有效方式实现所建议方法所需的所有细节。数值算例成功地证明了该方法的有效性。

MSC公司:

90C29型 多目标规划
90立方厘米 马尔可夫和半马尔可夫决策过程
47A52型 线性算子和不适定问题,正则化
65层22 数值线性代数中的不适定性和正则化问题
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bueno L,Haeser G,Martinez J(2015)加权和尺度化下多目标约束优化问题的不精确恢复方法。Optim Lett 1-11号文件。doi:10.1007/s11590-015-0928-x
[2] 波拉奇克,RS;卡亚,塞浦路斯;Rizvi,MM,用新的尺度化技术逼近不连通可行集问题的Pareto前沿,《最优化理论应用杂志》,162,428-446,(2014)·Zbl 1298.90091号 ·doi:10.1007/s10957-013-0346-0
[3] JB克莱姆普纳;Poznyak,AS,《客户生命周期价值的简单计算:一种固定的局部最优政策方法》,《系统科学与系统工程杂志》,23,439-459,(2014)·doi:10.1007/s11518-014-5260-y
[4] JB克莱姆普纳;Poznyak,AS,使用最小欧几里得距离优化方法求解非线性多目标马尔可夫链的Pareto前沿,数学计算模拟,119C,142-160,(2016)·Zbl 1527.90196号 ·doi:10.1016/j.matcom.2015.08.004
[5] Das I,Dennis J(1998)《正规边界交集:在多准则优化问题中生成pareto最优点的替代方法》。SIAM J优化8:631-657·Zbl 0911.90287号
[6] Deb K(2001)使用进化算法的多目标优化。纽约威利·Zbl 0970.90091号
[7] Deb K、Agrawal S、Pratap A、Meyarivan T(2000a)《自然中的并行问题解决》。Chap多目标优化的快速精英非支配排序遗传算法:NSGA-II,第六卷,柏林斯普林格,第849-858页·Zbl 1137.90015号
[8] Deb K,Pratap S,Meyarivan A(2000b)用于多目标优化的快速精英非支配排序遗传算法:Nsga-ii。摘自:《自然VI会议并行问题解决会议录》。巴黎施普林格,第849-858页
[9] Dellnitz,M;舒茨,O;Hestermeyer,T,用多级细分技术覆盖Pareto集,最优化理论应用杂志,124113-155,(2005)·Zbl 1137.90015号 ·doi:10.1007/s10957-004-6468-7
[10] 杜塔,J;Kaya,CY,构建多目标优化问题弱Pareto前沿的一种新的尺度化和数值方法,optimization,60,1091-1104,(2011)·Zbl 1232.65086号 ·doi:10.1080/02331934.2011.587006
[11] Ehrgott M(2005)多准则优化,2。教育部。柏林施普林格·Zbl 1132.90001号
[12] Eichfelder G(2008)多目标优化中的可伸缩方法。柏林施普林格·Zbl 1145.90001号 ·doi:10.1007/978-3-540-79159-1
[13] Eichfelder,G,多目标优化中的自适应尺度化方法,SIAM J Optim,19,1694-1718,(2009)·Zbl 1187.90252号 ·doi:10.1137/060672029
[14] 埃尔法尼,T;Utyuzhnikov,S,定向搜索域:多目标优化中均匀生成Pareto边界的方法,Eng Optim,43,467-484,(2011)·doi:10.1080/0305215X.2010.497185
[15] Fieldsend JE,Singh S(2002)基于粒子群优化、高效数据结构和湍流的多目标算法。收录:2002年英国计算智能研讨会论文集,伯明翰,3744页
[16] Fliege J,Heseler A(2003)构建凸二次多目标问题有效集的近似。德国多特蒙德大学技术代表
[17] Fonseca CM、Fleming PJ、Zitzler E、Deb K、Thiele L(eds)(2003)第二届进化多准则优化国际会议(EMO 2003)·Zbl 0787.65037号
[18] Garcia CB,Zangwill WI(1981)解决方案之路。In:不动点和平衡。普伦蒂斯·霍尔,恩格尔伍德悬崖·兹比尔0512.90070
[19] Germeyer Y(1971)运筹学理论导论。莫斯科瑙卡
[20] Germeyer Y(1976)非对抗性兴趣游戏。莫斯科瑙卡
[21] Harada JK,Sakuma A,Kobayashi S,Ono I(2007)通过pareto路径跟踪对局部pareto最优解曲线进行均匀采样及其在多目标ga中的应用。in:遗传与进化计算会议(GECCO 2007),英国,伦敦,第813-820页
[22] Hartikainen,M;米提宁,K;Wiecek,MM,为决策构建Pareto前沿近似,数学方法Oper Res,73209-234,(2011)·兹比尔1216.49002 ·doi:10.1007/s00186-010-0343-0
[23] Hartikainen,M;米提宁,K;Wiecek,MM,Paint:非线性多目标优化的Pareto前沿插值,Comput Optim Appl,52,845-867,(2012)·Zbl 1259.90119号 ·doi:10.1007/s10589-011-9441-z
[24] Hillermeier,C,多目标优化的广义同伦方法,最优化理论应用杂志,110,557-583,(2001)·Zbl 1064.90041号 ·doi:10.1023/A:1017536311488
[25] Hillermeier C(2001b)非线性多目标优化:广义同伦方法。收录于:国际数值数学系列,第135卷。巴塞尔Birkauser·兹比尔0966.90069
[26] Jahn J(1986)部分序线性空间中的数学向量优化,第31卷。Verlag Peter Lang GmbH,柏林·Zbl 0578.90048号
[27] Lovison,A,《多目标优化的全球搜索视角》,J Global Optim,57,385-398,(2013)·Zbl 1274.90274号 ·doi:10.1007/s10898-012-9943-y
[28] Martin B、Goldsztejn A、Granvilliers L、Jermann C(2014)《非线性双目标优化的连续方法:走向经认证的基于间隔的方法》。J全球优化。文件编号:10.1007/s10898-014-0201-3·兹比尔1332.90251
[29] 梅赛克,A;Mattson,C,使用物理编程为工程设计生成均匀分布的Pareto点集,Optim Eng,3431-450,(2002)·Zbl 1079.90627号 ·doi:10.1023/A:1021179727569
[30] 梅赛克,A;Mattson,C,保证完全Pareto前沿均匀表示的规范化正规约束方法,AIAA J,422101-2111,(2004)·数字对象标识代码:10.2514/1.8977
[31] 梅赛克,A;伊斯梅尔·雅哈亚,A;Mattson,C,生成Pareto边界的规范化法向约束方法,结构多学科优化,25,86-98,(2003)·Zbl 1243.90200号 ·doi:10.1007/s00158-002-0276-1
[32] Miettinen K(1999)非线性多目标优化。阿姆斯特丹Kluwer学术出版社·Zbl 0949.90082号
[33] Mostaghis S(2004)多目标进化算法,数据结构,收敛性和多样性。帕德博恩大学博士论文
[34] 帕累托五世(1896)洛桑大学经济学和政治学教授,第一卷洛桑大学,洛桑·Zbl 1079.90627号
[35] 帕雷托五世(1897)《洛桑大学经济学教授》,第二卷。洛桑洛桑大学·Zbl 1243.90200号
[36] Pereyra,V,多目标优化问题的等距Pareto流形和Pareto前沿的快速计算,数学计算模拟,791935-1947,(2009)·Zbl 1159.65060号 ·doi:10.1016/j.matcom.2007.02.007
[37] 佩雷拉五世;桑德斯,M;Castillo,J,约束双目标优化的等距Pareto前沿构造,数学计算模型,572122-2131,(2013)·Zbl 1286.90138号 ·doi:10.1016/j.mcm.2010.12.044
[38] Potschka,A;Logist,F;阻抗,J;Bock,H,利用ODE技术追踪生物目标优化问题中的Pareto前沿,数值算法,217-233217-233,(2011)·Zbl 1217.65110号 ·doi:10.1007/s11075-010-9425-6
[39] Poznyak AS(2008)面向自动控制工程师的高级数学工具。确定性技术,第1卷。阿姆斯特丹爱思唯尔·兹比尔1216.49002
[40] Poznyak AS(2009)为自动控制工程师提供高级数学工具。确定性技术,第2卷。阿姆斯特丹爱思唯尔
[41] Poznyak AS,Najim K,Gomez-Ramirez E(2000)有限马尔可夫链的自学习控制。Marcel Dekker,纽约·兹比尔0960.93001
[42] 拉科夫斯卡,J;哈夫特卡,RT;Watson,LT,追踪多目标控制结构优化的有效曲线,SIAM J Optim,3654-667,(1993)·Zbl 0787.65037号 ·数字对象标识代码:10.1137/0803033
[43] 莱茵堡,WC;Burkardt,J,Pitcon:局部参数化连续过程的程序,ACM Trans Math Softw(TOMS),9,236-241,(1983)·doi:10.1145/357456.357461
[44] 林坎普,M;Ober-Blbaum,S;Dellnitz,M;Schutze,O,通过切线空间的逐次逼近用多目标延拓方法处理高维问题,Eng-Optim,441117-1146,(2012)·doi:10.1080/0305215X.2011.634407
[45] Ruzika,S;Wiecek,MM,《多目标规划中的近似方法》,《最优化理论应用杂志》,126473-501,(2005)·邮编1093.90057 ·doi:10.1007/s10957-005-5494-4
[46] 沙夫勒,S;舒尔茨,R;Weinzierl,K,求解无约束向量优化问题的随机方法,最优化理论应用杂志,114209-222,(2002)·Zbl 1022.90027号 ·doi:10.1023/A:1015472306888
[47] Schittkowski K(1999)Easy-opt:一个具有自动区分用户指南的交互式优化系统。拜勒大学数学系技术代表
[48] Schutze O,Mostaghim S,Dellnitz M,Teich J(2003)通过多级进化细分技术覆盖帕累托集。In:Fonseca CM、Fleming PJ、Zitzler E、Deb K、Thiele L(eds)进化多准则优化·Zbl 1036.90552号
[49] Steuer RE(1986)《多准则优化:理论、计算和应用》。纽约威利·Zbl 1298.90091号
[50] Steuer RE(1989)使用微型计算机进行多准则决策和风险分析。In:交互式多目标规划的切比切过程。柏林施普林格,第235-249页
[51] Tikhonov A、Goncharsky A、Stepanov V、Yagola AG(1995)《求解病态问题的数值方法》。荷兰Kluwer学术出版社·兹比尔08316.5059
[52] Tikhonov AN,Arsenin VY(1977)《病态问题的解决方案》。华盛顿州温斯顿父子公司·Zbl 0354.65028号
[53] 托斯,BG;Kreinovich,V,计算Pareto集的验证方法:一般算法分析,国际应用数学计算科学杂志,19,369-380,(2009)·Zbl 1300.90041号
[54] 尤尤日尼科夫,S;范蒂尼,P;Guenov,M,非线性多目标优化中生成均匀分布Pareto集的方法,计算应用数学杂志,223820-841,(2009)·Zbl 1165.90637号 ·doi:10.1016/j.cam.2008.03.011
[55] Zangwill WI(1969)《非线性规划:统一方法》。普伦蒂斯·霍尔,恩格尔伍德悬崖·Zbl 0195.20804号
[56] Zitzler E,Laumanns M,Thiele L(2002)Spea2:改进pareto进化算法的强度。In:设计、优化和控制的进化方法,应用于工业问题。工程数值方法中心(CIMNE 2002),巴塞罗那,第95-100页·Zbl 1232.65086号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。