文件Zbl 1405.68229-zbMATH Open

连续时间Markov决策过程的最大成本有界可达概率。（英文） Zbl 1405.68229号

Muscholl，Anca（编辑），《软件科学和计算结构基础》。第17届国际会议，FOSSACS 2014，作为欧洲软件理论与实践联合会议的一部分，ETAPS 2014，法国格勒诺布尔，2014年4月5日至13日。诉讼程序。柏林：施普林格出版社（ISBN 978-3-642-54829-1/pbk）。计算机科学课堂讲稿8412，73-87（2014）。

摘要：在本文中，我们考虑了连续时间Markov决策过程（CTMDP）的多维最大成本有界可达概率。我们的主要贡献如下。首先，我们导出了一个积分特征，它表明最大代价有界可达概率函数是积分方程组的最小不动点。其次，我们证明了最大成本有界可达概率可以通过一个可测量的确定成本位置调度器获得。第三，我们给出了最大代价有界可达概率的数值逼近算法。我们在早期和晚期调度程序的设置下显示这些结果。此外，我们通过对多维最大成本有界可达概率的更一般情况的全新证明，纠正了Martin Neuháußer博士论文中关于最大时间有界可达可能性的一个基本证明错误。
关于整个系列，请参见[Zbl 1284.68025号].

引用于2文件

MSC公司：

87年第68季度	计算机科学中的概率（算法分析、随机结构、相变等）
60年28日	连续时间Markov过程在离散状态空间中的应用
2010年第68季度	计算模式（非确定性、并行、交互式、概率性等）

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：书本；一：书籍文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

连续时间Markov决策过程的最大成本有界可达概率。（英文） Zbl 1405.68229号

MSC公司：

示例

领域

操作员

连续时间Markov决策过程的最大成本有界可达概率。 （英文） Zbl 1405.68229号

MSC公司：

连续时间Markov决策过程的最大成本有界可达概率。（英文） Zbl 1405.68229号