摘要
M.L.Puterman, 马尔可夫决策过程。 威利,1994年。 谷歌学者 K.Chatterjee和L.Doyen,“能量和平均值平价Markov决策过程” MFCS 2011年 第6907卷,2011年,第206-218页。 谷歌学者 数字图书馆 K.Chatterjee,“具有平均值平价和能量平价目标的博弈和马尔可夫决策过程”,in 程序。 MEMICS的 ,序列号。 LNCS,第7119卷。 施普林格,2011年,第37-46页。 谷歌学者 数字图书馆 A.Chakrabarti、L.De Alfaro、T.A.Henzinger和M.Stoelinga,《资源接口》,in 嵌入式软件国际研讨会。 斯普林格,2003年,第117-133页。 谷歌学者 P.Bouyer、U.Fahrenberg、K.G.Larsen、N.Markey和J.Srba, 具有能量约束的加权时间自动机的无穷次运行 ,序列号。 LNCS公司。 施普林格,2008年,第5215卷,第33-47页。 谷歌学者 数字图书馆 R.Bloem、K.Chatterjee、T.A.Henzinger和B.Jobstmann,《通过定量目标提高合成质量》 CAV汽车 ,序列号。 LNCS,第5643卷,2009年,第140-156页。 谷歌学者 数字图书馆 N.Berger、N.Kapur、L.Schulman和V.Vazirani,《偿付能力游戏》 FSTTCS公司 ,序列号。 LIPIcs,2008年第2卷,第61-72页。 谷歌学者 K.Chatterjee、T.A.Henzinger和M.Jurdzinski,《Mean-payoff平价游戏》 低收入国家 2005年,第178-187页。 谷歌学者 数字图书馆 K.Chatterjee和L.Doyen,“能源平价游戏” 理论计算机科学 ,第458卷,第49-60页,2012年。 谷歌学者 交叉引用 T.Brázdil、A.Kučera和P.Novotní,《优化能源马尔可夫决策过程中的预期平均收益》 ATVA公司 ,序列号。 LNCS,第9938卷。 Springer,2016年,第32-49页,完整版本见 https://arxiv.org/abs/1607.00678。 谷歌学者 T.Brázdil、V.Broíek、K.Etessami、A.Kučera和D.Wojtczak,《单计数器马尔可夫决策过程》 SODA公司 《工业和应用数学学会》,2010年,第863--874页。 谷歌学者 数字图书馆 T.Brázdil、V.Broíek和K.Etessami,《一对随机游戏》 FSTTCS公司 ,序列号。 LIPIcs,2010年第8卷,第108-119页。 谷歌学者 R.Mayr、S.Schewe、P.Totzke和D.Wojtczak,“具有能源平价目标的MDP” CoRR公司 ,第abs/1701.02546卷,2017年。 {在线}。 可用: http://arxiv.org/abs/1701.02546 谷歌学者 P.Billingsley, 概率与测度 。纽约,NY:Wiley,1995年,第三版。 谷歌学者 N.Karmarkar,“线性规划的新多项式时间算法” 随机存取存储器 1984年,第302-311页。 谷歌学者 数字图书馆 K.Etessami、D.Wojtczak和M.Yannakakis,“准生灭过程、树状QBD、概率1-计数器自动机和下推系统,” 绩效评估 ,第67卷,第9期,第837--857页,2010年。 谷歌学者 数字图书馆 T.Brázdil、S.Kiefer和A.Kučera,“使用无限计数器对概率程序进行有效分析” 美国计算机学会期刊 ,第61卷,第6期,第41:1--41:35页,2014年。 谷歌学者 数字图书馆 R.Durrett、H.Kesten和G.Lawler,《从公平游戏中赚钱》 随机行走、布朗运动和相互作用的粒子系统。 Springer Science+Business Media,LLC,1991年,第255-267页。 谷歌学者 L.De Alfaro,“概率系统的形式验证”,斯坦福大学博士论文,1997年。 谷歌学者 K.Chatterjee、M.Jurdziñski和T.A.Henzinger,《定量随机平价游戏》 第十五届ACM-SIAM离散算法年会论文集, 2004年,第121-130页。 谷歌学者 数字图书馆 N.Immerman,“量词的数量比磁带单元的数量好,” 计算机与系统科学杂志 ,第22卷,第3期,第384页至第406页,1981年。 谷歌学者 交叉引用 U.Zwick和M.Paterson,“图上平均回报游戏的复杂性” 理论计算机科学 ,第158卷,第1期,第343-359页,1996年。 谷歌学者 数字图书馆 P.Abdulla、R.Mayr、A.Sangnier和J.Sproston,《求解整数向量上的奇偶博弈》 程序。 CONCUR的 ,序列号。 LNCS,第8052卷,2013年。 谷歌学者 数字图书馆 P.A.Abdulla、R.Ciobanu、R.Mayr、A.Sangnier和J.Sproston,《VASS诱导MDP的定性分析》,摘自 FOSSACS公司 ,序列号。 LNCS,第9634卷,2016年。 谷歌学者
建议
可数MDP中的平价目标 LICS’17:第32届ACM/IEEE计算机科学逻辑年会论文集 我们研究了具有奇偶目标的可数无限MDP,以及Mostowski层次中颜色数有界的特殊情况(包括可达性、安全性、Büchi和co-Büchi.)。 在有限MDP中总是存在最优无记忆。。。 能量和平均值奇偶马尔可夫决策过程 MFCS’11:第36届计算机科学数学基础国际会议论文集 我们考虑具有平均间隔奇偶性和能量奇偶性目标的马尔可夫决策过程(MDP)。 在系统设计中,奇偶性目标用于编码ω-正则规范,而平均路径和能量目标可用于建模ω-正规规范。。。