文件Zbl 1218.90209-zbMATH打开

带约束的折扣连续时间马尔可夫决策过程：无界转移和损失率。（英语） Zbl 1218.90209号

数学。操作。物件。第1期第36页，第105-132页（2011年）.

摘要：本文研究带约束的可数连续时间马尔可夫决策过程。最小化的最优性标准是期望折现损失，同时施加了几种相同类型的约束。过渡率可以是无限的，损失率也可以是无限的（从上到下），并且策略可以是历史相关的和随机的。基于Kolmogorov的正向方程和Dynkin公式，我们提醒读者注意Bellman方程，介绍和研究占用测度，将优化问题重新表述为一个（初级）线性规划，在此为约束优化问题提供最优策略的形式，并建立了凸分析方法与动态规划的对偶关系。最后，给出了一系列示例来说明我们的所有结果。

引用于38文件

MSC公司：

90立方厘米	马尔可夫和半马尔可夫决策过程
60J27型	离散状态空间上的连续时间马尔可夫过程

关键词：

连续时间马尔可夫决策过程;无界转换率;动态程序设计;凸解析法;占用措施;约束最优政策

PDF格式 BibTeX公司 XML格式引用

全文：内政部

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	综述，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文件类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

带约束的折扣连续时间马尔可夫决策过程：无界转移和损失率。（英语） Zbl 1218.90209号

MSC公司：

关键词：

示例

领域

操作员

带约束的折扣连续时间马尔可夫决策过程：无界转移和损失率。 （英语） Zbl 1218.90209号

MSC公司：

关键词：

带约束的折扣连续时间马尔可夫决策过程：无界转移和损失率。（英语） Zbl 1218.90209号