×

用于构造Pareto集的邻域搜索。 (英语) 兹比尔1216.90077

摘要:本文描述了邻域搜索,这是我们建议的一种有效的方法,用于构造具有生成阶的多目标问题的Pareto集。然后将邻域搜索应用于折扣马尔可夫决策过程,得到关于Pareto集拓扑性质的原始声明。最后给出了一个有意义的例子。

理学硕士:

90C29型 多目标规划
90立方厘米40 马尔可夫和半马尔可夫决策过程
90立方厘米 动态编程
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Altman E(1999)约束马尔可夫决策过程。Chapman和Hall/CRC,博卡拉顿
[2] Armand P(1993)在多目标线性规划中寻找所有最大有效面。数学程序61:357–375·Zbl 0795.90054号 ·doi:10.1007/BF01582157
[3] Armand P,Malivert C(1991)多目标线性规划中有效集的确定。J Optim理论应用70:467–488·Zbl 0793.90064号 ·doi:10.1007/BF00941298
[4] Bertsekas DP(2003)凸分析与优化。雅典娜科技公司,贝尔蒙特·Zbl 1140.90001号
[5] Bertsekas DP,Shreve SE(1978)随机最优控制。学术出版社,N.Y-S.Francisco-London
[6] Chen RC,Blankenship GL(2004),折扣约束随机控制的动态规划方程。IEEE Trans-Aut控制49:699–709·Zbl 1365.93540号 ·doi:10.1109/TAC.2004.826725
[7] Dattoro J(2005)凸优化和欧氏距离几何。美国Meboo出版社
[8] Dynkin EB,Yushkevich AA(1979)受控马尔可夫过程及其应用。施普林格,柏林-海德堡-纽约
[9] Ehrgott M(2000)多准则优化。经济学和数学系统讲义,第491卷。施普林格,柏林-海德堡-纽约·兹比尔0956.90039
[10] Feinberg EA(2000)约束折扣马尔可夫决策过程和哈密顿循环。数学运算研究25:130–140·Zbl 1073.90567号 ·doi:10.1287/门25.1.130.15210
[11] Feinberg EA,Shwartz A(1996)约束折扣动态规划。数学运算研究21:922–945·Zbl 0867.90123号 ·doi:10.1287/门21.4.922
[12] Feinberg E,Piunovskiy A(2002)多准则非原子总报酬马氏决策过程。数学与分析应用杂志273:93–111·Zbl 1012.90069号 ·doi:10.1016/S0022-247X(02)00213-5
[13] Furukawa N(1980)状态空间可数的向量值马氏决策过程。摘自:Hartley R、Thomas LC、White DJ(编辑)Markov决策过程的最新发展。学术出版社,伦敦-纽约,第205-223页
[14] Ghosh MK(1990)具有多重成本的马尔可夫决策过程。运营Res Lett 9:257–260·Zbl 0706.90090号 ·doi:10.1016/0167-6377(90)90070-L
[15] Hernandez-Lerma O,Romera R(2004)多目标Markov控制问题的标量化方法:为什么有效?应用数学优化50:279–293·Zbl 1081.90056号 ·文件编号:10.1007/s00245-004-0804-4
[16] Heyman DP、Sobel MJ(1984)《运筹学中的随机模型——随机优化》,第二卷。纽约麦格罗-希尔图书公司·Zbl 0531.90062号
[17] Kaliszewski I(1994)通过锥分离技术进行定量Pareto分析。波士顿Kluwer·Zbl 0839.90101号
[18] Magaril-Il'yaev GG,Tikhomirov VM(2003),凸分析:理论与应用。Amer数学Soc Providence
[19] Meyer P-A(1966)概率和潜力。布莱斯德尔。马萨诸塞州沃尔瑟姆-多伦多-隆顿·Zbl 0138.10401号
[20] Micevski T、Kuczera G、Coombes PJ(2002)雨水管道劣化的马尔可夫模型。基础设施系统杂志8:49–56·doi:10.1061/(ASCE)1076-0342(2002)8:2(49)
[21] Piunovskiy AB(1997)约束问题中随机序列的最优控制。多德雷赫特·克鲁沃·Zbl 0894.93001号
[22] Piunovskiy A(1998)受控随机序列:凸分析方法和函数约束问题。俄罗斯数学调查56:1233–1293·Zbl 0941.93056号 ·doi:10.1070/RM1998v053n06ABEH000090
[23] Piunovskiy A,Mao X(2000)约束马尔科夫决策过程:动态规划方法。运营Res Lett 27:119–126·兹比尔0969.90091 ·doi:10.1016/S0167-6377(00)00039-0
[24] Preparia FP、Shamos MI(1993)《计算几何》。施普林格,柏林-海德堡-纽约
[25] Puterman ML(1994)Markov决策过程。纽约威利·Zbl 0829.90134号
[26] Stoer J,Witzgall C(1970)有限维凸性与优化。施普林格,柏林-海德堡-纽约·Zbl 0203.52203号
[27] Wakuta K(1996)向量值Markov决策过程中的一类新策略。数学分析应用杂志202:623–628·兹比尔0856.90125 ·doi:10.1006/jmaa.1996.0337
[28] Wakuta K(1998)带约束的折扣成本马尔可夫决策过程。Prob Eng Inf Sci 12:177–187(工程与信息科学)·Zbl 0948.90146号 ·doi:10.1017/S0269964800005131
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。