×

连续时间Markov决策过程的最大成本有界可达概率。 (英文) Zbl 1405.68229号

Muscholl,Anca(编辑),《软件科学和计算结构基础》。第17届国际会议,FOSSACS 2014,作为欧洲软件理论与实践联合会议的一部分,ETAPS 2014,法国格勒诺布尔,2014年4月5日至13日。诉讼程序。柏林:施普林格出版社(ISBN 978-3-642-54829-1/pbk)。计算机科学课堂讲稿8412,73-87(2014)。
摘要:在本文中,我们考虑了连续时间Markov决策过程(CTMDP)的多维最大成本有界可达概率。我们的主要贡献如下。首先,我们导出了一个积分特征,它表明最大代价有界可达概率函数是积分方程组的最小不动点。其次,我们证明了最大成本有界可达概率可以通过一个可测量的确定成本位置调度器获得。第三,我们给出了最大代价有界可达概率的数值逼近算法。我们在早期和晚期调度程序的设置下显示这些结果。此外,我们通过对多维最大成本有界可达概率的更一般情况的全新证明,纠正了Martin Neuháußer博士论文中关于最大时间有界可达可能性的一个基本证明错误。
关于整个系列,请参见[Zbl 1284.68025号].

MSC公司:

87年第68季度 计算机科学中的概率(算法分析、随机结构、相变等)
60年28日 连续时间Markov过程在离散状态空间中的应用
2010年第68季度 计算模式(非确定性、并行、交互式、概率性等)
PDF格式BibTeX公司 XML格式引用