文件Zbl 1216.90077-zbMATH Open

多里尼，G。;F.Di皮耶罗;萨维奇，D。;A.B.皮乌诺夫斯基。

用于构造Pareto集的邻域搜索。（英语）兹比尔1216.90077

数学。方法操作。物件。 65，第2期，315-337（2007）.

摘要：本文描述了邻域搜索，这是我们建议的一种有效的方法，用于构造具有生成阶的多目标问题的Pareto集。然后将邻域搜索应用于折扣马尔可夫决策过程，得到关于Pareto集拓扑性质的原始声明。最后给出了一个有意义的例子。

理学硕士：

90C29型	多目标规划
90立方厘米40	马尔可夫和半马尔可夫决策过程
90立方厘米	动态编程

关键词：

多目标优化;con-generated订单;凸分析;帕累托集;马尔可夫决策过程（MDP）;动态规划;线性规划

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	Altman E（1999）约束马尔可夫决策过程。Chapman和Hall/CRC，博卡拉顿
[2]	Armand P（1993）在多目标线性规划中寻找所有最大有效面。数学程序61:357–375·Zbl 0795.90054号 ·doi:10.1007/BF01582157
[3]	Armand P，Malivert C（1991）多目标线性规划中有效集的确定。J Optim理论应用70:467–488·Zbl 0793.90064号 ·doi:10.1007/BF00941298
[4]	Bertsekas DP（2003）凸分析与优化。雅典娜科技公司，贝尔蒙特·Zbl 1140.90001号
[5]	Bertsekas DP，Shreve SE（1978）随机最优控制。学术出版社，N.Y-S.Francisco-London
[6]	Chen RC，Blankenship GL（2004），折扣约束随机控制的动态规划方程。IEEE Trans-Aut控制49:699–709·Zbl 1365.93540号 ·doi:10.1109/TAC.2004.826725
[7]	Dattoro J（2005）凸优化和欧氏距离几何。美国Meboo出版社
[8]	Dynkin EB，Yushkevich AA（1979）受控马尔可夫过程及其应用。施普林格，柏林-海德堡-纽约
[9]	Ehrgott M（2000）多准则优化。经济学和数学系统讲义，第491卷。施普林格，柏林-海德堡-纽约·兹比尔0956.90039
[10]	Feinberg EA（2000）约束折扣马尔可夫决策过程和哈密顿循环。数学运算研究25:130–140·Zbl 1073.90567号 ·doi:10.1287/门25.1.130.15210
[11]	Feinberg EA，Shwartz A（1996）约束折扣动态规划。数学运算研究21:922–945·Zbl 0867.90123号 ·doi:10.1287/门21.4.922
[12]	Feinberg E，Piunovskiy A（2002）多准则非原子总报酬马氏决策过程。数学与分析应用杂志273:93–111·Zbl 1012.90069号 ·doi:10.1016/S0022-247X（02）00213-5
[13]	Furukawa N（1980）状态空间可数的向量值马氏决策过程。摘自：Hartley R、Thomas LC、White DJ（编辑）Markov决策过程的最新发展。学术出版社，伦敦-纽约，第205-223页
[14]	Ghosh MK（1990）具有多重成本的马尔可夫决策过程。运营Res Lett 9:257–260·Zbl 0706.90090号 ·doi:10.1016/0167-6377（90）90070-L
[15]	Hernandez-Lerma O，Romera R（2004）多目标Markov控制问题的标量化方法：为什么有效？应用数学优化50:279–293·Zbl 1081.90056号 ·文件编号：10.1007/s00245-004-0804-4
[16]	Heyman DP、Sobel MJ（1984）《运筹学中的随机模型——随机优化》，第二卷。纽约麦格罗-希尔图书公司·Zbl 0531.90062号
[17]	Kaliszewski I（1994）通过锥分离技术进行定量Pareto分析。波士顿Kluwer·Zbl 0839.90101号
[18]	Magaril-Il'yaev GG，Tikhomirov VM（2003），凸分析：理论与应用。Amer数学Soc Providence
[19]	Meyer P-A（1966）概率和潜力。布莱斯德尔。马萨诸塞州沃尔瑟姆-多伦多-隆顿·Zbl 0138.10401号
[20]	Micevski T、Kuczera G、Coombes PJ（2002）雨水管道劣化的马尔可夫模型。基础设施系统杂志8:49–56·doi:10.1061/（ASCE）1076-0342（2002）8:2（49）
[21]	Piunovskiy AB（1997）约束问题中随机序列的最优控制。多德雷赫特·克鲁沃·Zbl 0894.93001号
[22]	Piunovskiy A（1998）受控随机序列：凸分析方法和函数约束问题。俄罗斯数学调查56:1233–1293·Zbl 0941.93056号 ·doi:10.1070/RM1998v053n06ABEH000090
[23]	Piunovskiy A，Mao X（2000）约束马尔科夫决策过程：动态规划方法。运营Res Lett 27:119–126·兹比尔0969.90091 ·doi:10.1016/S0167-6377（00）00039-0
[24]	Preparia FP、Shamos MI（1993）《计算几何》。施普林格，柏林-海德堡-纽约
[25]	Puterman ML（1994）Markov决策过程。纽约威利·Zbl 0829.90134号
[26]	Stoer J，Witzgall C（1970）有限维凸性与优化。施普林格，柏林-海德堡-纽约·Zbl 0203.52203号
[27]	Wakuta K（1996）向量值Markov决策过程中的一类新策略。数学分析应用杂志202:623–628·兹比尔0856.90125 ·doi:10.1006/jmaa.1996.0337
[28]	Wakuta K（1998）带约束的折扣成本马尔可夫决策过程。Prob Eng Inf Sci 12:177–187（工程与信息科学）·Zbl 0948.90146号 ·doi:10.1017/S0269964800005131

此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配，并且可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
实验室	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b：book；一：图书文章）

一&b	逻辑和
一\|b	逻辑或
!实验室	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

用于构造Pareto集的邻域搜索。（英语）兹比尔1216.90077

理学硕士：

关键词：

参考文献：

示例

领域

操作员

用于构造Pareto集的邻域搜索。 （英语） 兹比尔1216.90077

理学硕士：

关键词：

参考文献：

用于构造Pareto集的邻域搜索。（英语）兹比尔1216.90077