跳到主要内容
10.5555/3329995.3330066acm会议文章/章节视图摘要出版物页面低收入国家会议记录会议集合
研究论文

具有能量平价目标的MDP

出版:2017年6月20日出版历史

摘要

能量平价目标结合了ω-规则和奖励MDP的定量目标。控制器需要避免在满足奇偶目标的同时耗尽能量。

我们驳斥了一种普遍的观点,即如果能量平价目标几乎成立,那么这可以通过某种有限记忆策略实现。我们提供了一个仅使用coBüchi条件的令人惊讶的简单反例。

我们引入了一类新的有界(能量)存储目标,当与奇偶目标结合时,该类目标保持有限存储特性。在此基础上,我们证明了能量奇偶性MDP的近似和极限能量奇偶目标,以及近似和极限存储奇偶性目标都是NP-coNP,可以在伪多项式时间内求解。

工具书类

  1. M.L.Puterman,马尔可夫决策过程。威利,1994年。谷歌学者谷歌学者
  2. K.Chatterjee和L.Doyen,“能量和平均值平价Markov决策过程”2011年MFCS,2011年第6907卷,第206-218页。谷歌学者谷歌学者数字图书馆数字图书馆
  3. K.Chatterjee,“具有平均值平价和能量平价目标的博弈和马尔可夫决策过程”,in程序。MEMICS的,序列号。LNCS,第7119卷。施普林格,2011年,第37-46页。谷歌学者谷歌学者数字图书馆数字图书馆
  4. A.Chakrabarti、L.De Alfaro、T.A.Henzinger和M.Stoelinga,《资源接口》,in嵌入式软件国际研讨会。斯普林格,2003年,第117-133页。谷歌学者谷歌学者
  5. P.Bouyer、U.Fahrenberg、K.G.Larsen、N.Markey和J.Srba,具有能量约束的加权时间自动机的无穷次运行,序列号。LNCS公司。施普林格,2008年,第5215卷,第33-47页。谷歌学者谷歌学者数字图书馆数字图书馆
  6. R.Bloem、K.Chatterjee、T.A.Henzinger和B.Jobstmann,“通过定量目标提高合成质量”CAV汽车,序列号。LNCS,第5643卷,2009年,第140-156页。谷歌学者谷歌学者数字图书馆数字图书馆
  7. N.Berger、N.Kapur、L.Schulman和V.Vazirani,《偿付能力游戏》FSTTCS公司,序列号。LIPIcs,2008年第2卷,第61-72页。谷歌学者谷歌学者
  8. K.Chatterjee、T.A.Henzinger和M.Jurdzinski,《Mean-payoff平价游戏》低收入国家2005年,第178-187页。谷歌学者谷歌学者数字图书馆数字图书馆
  9. K.Chatterjee和L.Doyen,“能源平价游戏”理论计算机科学,第458卷,第49-60页,2012年。谷歌学者谷歌学者交叉引用交叉引用
  10. T.Brázdil、A.Kučera和P.Novotní,《优化能源马尔可夫决策过程中的预期平均收益》ATVA公司,序列号。LNCS,第9938卷。Springer,2016年,第32-49页,完整版本见https://arxiv.org/abs/1607.00678。谷歌学者谷歌学者
  11. T.Brázdil、V.Broíek、K.Etessami、A.Kučera和D.Wojtczak,《单计数器马尔可夫决策过程》SODA公司《工业和应用数学学会》,2010年,第863--874页。谷歌学者谷歌学者数字图书馆数字图书馆
  12. T.Brázdil、V.Broíek和K.Etessami,《一对随机游戏》FSTTCS公司,序列号。LIPIcs,2010年第8卷,第108-119页。谷歌学者谷歌学者
  13. R.Mayr、S.Schewe、P.Totzke和D.Wojtczak,“具有能源平价目标的MDP”CoRR公司,第abs/1701.02546卷,2017年。{联机}。可用:http://arxiv.org/abs/1701.02546谷歌学者谷歌学者
  14. P.Billingsley,概率与测度纽约州纽约市:威利出版社,1995年,第三版。谷歌学者谷歌学者
  15. N.Karmarkar,“线性规划的新多项式时间算法”STOC公司1984年,第302-311页。谷歌学者谷歌学者数字图书馆数字图书馆
  16. K.Etessami、D.Wojtczak和M.Yannakakis,“准生灭过程、树状QBD、概率1-计数器自动机和下推系统,”绩效评估,第67卷,第9期,第837--857页,2010年。谷歌学者谷歌学者数字图书馆数字图书馆
  17. T.Brázdil、S.Kiefer和A.Kučera,“使用无限计数器对概率程序进行有效分析”美国医学会杂志,第61卷,第6期,第41:1--41:35页,2014年。谷歌学者谷歌学者数字图书馆数字图书馆
  18. R.Durrett、H.Kesten和G.Lawler,《从公平游戏中赚钱》随机行走、布朗运动和相互作用的粒子系统。施普林格科学+商业媒体有限责任公司,1991年,第255-267页。谷歌学者谷歌学者
  19. L.De Alfaro,“概率系统的形式验证”,斯坦福大学博士论文,1997年。谷歌学者谷歌学者
  20. K.Chatterjee、M.Jurdziñski和T.A.Henzinger,《定量随机平价游戏》第十五届ACM-SIAM离散算法年会论文集,2004年,第121-130页。谷歌学者谷歌学者数字图书馆数字图书馆
  21. N.Immerman,“量词的数量比磁带单元的数量好,”计算机与系统科学杂志,第22卷,第3期,第384-406页,1981年。谷歌学者谷歌学者交叉引用交叉引用
  22. U.Zwick和M.Paterson,“图上平均回报游戏的复杂性”理论计算机科学,第158卷,第1期,第343-359页,1996年。谷歌学者谷歌学者数字图书馆数字图书馆
  23. P.Abdulla、R.Mayr、A.Sangnier和J.Sproston,《求解整数向量上的奇偶博弈》程序。CONCUR的,序列号。LNCS,第8052卷,2013年。谷歌学者谷歌学者数字图书馆数字图书馆
  24. P.A.Abdulla、R.Ciobanu、R.Mayr、A.Sangnier和J.Sproston,《VASS诱导MDP的定性分析》,摘自FOSSACS公司,序列号。LNCS,第9634卷,2016年。谷歌学者谷歌学者

建议

评论

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

登录

完全访问权限

  • 发布于

    封面图片ACM会议
    LICS’17:第32届ACM/IEEE计算机科学逻辑年会论文集
    2017年6月
    1068页
    国际标准图书编号:9781509030187

    出版商

    IEEE出版社

    出版历史

    • 出版:2017年6月20日

    检查更新

    限定符

    • 研究论文

    接受率

    总体验收率143属于386提交文件,37%
  • 文章指标

    • 下载次数(过去12个月)2
    • 下载次数(最近6周)0

    其他指标

PDF格式

以PDF文件查看或下载。

PDF格式

电子阅读器

使用eReader联机查看。

电子阅读器