文件Zbl 1126.68467-zbMATH Open

克里斯特尔·拜尔；Boudewijn，Haverkort；霍尔格·赫尔曼斯；Joost-Pieter卡托恩

一致连续时间Markov决策过程中时间有界可达概率的有效计算。（英语） Zbl 1126.68467号

Jensen，Kurt（编辑）等人，《系统构建和分析的工具和算法》。2004年3月29日至4月2日在西班牙巴塞罗那举行的第十届国际会议TACAS 2004，作为软件理论与实践联合会议ETAPS 2004的一部分。诉讼程序。柏林：施普林格出版社（ISBN 3-540-21299-X/pbk）。计算机科学课堂讲稿298861-76（2004）。

摘要：连续时间马尔可夫决策过程（CTMDP）是概率选择和非确定性选择共存的连续时间马尔柯夫链的推广。本文提出了一种有效的算法来计算统一CTMDP中在给定时间范围内达到一组目标状态的最大（或最小）概率，即每个状态访问的延迟时间分布对于所有状态都是相同的CTMDP。我们证明，对于以确定性或随机方式解决不确定性的（时间抽象的）历史依赖调度器和马尔科夫调度器，这些概率是一致的。
有关整个系列，请参见[Zbl 1046.68008号].

引用于2文件

MSC公司：

60年第68季度

规范和验证（程序逻辑、模型检查等）

PDF格式 BibTeX公司 XML格式引用

全文：内政部

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

一致连续时间Markov决策过程中时间有界可达概率的有效计算。（英语） Zbl 1126.68467号

MSC公司：

示例

领域

操作员

一致连续时间Markov决策过程中时间有界可达概率的有效计算。 （英语） Zbl 1126.68467号

MSC公司：

一致连续时间Markov决策过程中时间有界可达概率的有效计算。（英语） Zbl 1126.68467号