文件Open Access徽标

时间自动机上的Mean-Payoff游戏

作者 什巴希斯·古哈, 马金·尤金斯基(Marcin Jurdzinski), Shankara Narayanan Krishna, 阿什图什·特里维迪



PDF格式
缩略图PDF

文件

LIPIcs公司。FSTTCS.2016.44.pdf
  • 文件大小:0.63 MB
  • 14页

文件标识符

作者详细信息

什巴希斯·古哈
马金·尤金斯基(Marcin Jurdzinski)
桑卡拉·纳拉亚南·克里希纳
阿什图什·特里维迪

引用为获取BibTex

Shibashis Guha、Marcin Jurdzinski、Shankara Narayanan Krishna和Ashutosh Trivedi。定时自动机上的Mean-Payoff游戏。第36届IARCS软件技术和理论计算机科学基础年会(FSTTCS 2016)。莱布尼茨国际信息学论文集(LIPIcs),第65卷,第44:1-44:14页,达格斯图尔-莱布尼兹-泽特鲁姆信息学院(2016)
https://doi.org/10.4230/LIPIcs.FSTTCS.2016.44

摘要

时间自动机上的平均回报游戏在定价时间自动机配置的无限加权图上进行,在两个玩家(玩家最小和玩家最大)之间进行,方法是沿着图的状态移动一个标记以形成无限运行。“球员最小”的目标是最小化跑步的极限平均重量,而“球员最大”的目标则相反。Brenguier、Cassez和Raskin最近研究了这些游戏的一种变体,并表明对于具有五个或更多时钟的时间自动机来说,平均值游戏是不可判定的。我们通过证明三个时钟的平均对弈游戏的不可判定性来改进这个结果。从积极的方面来看,我们证明了在具有二进制价格比率的单时钟时间自动机上的平均对赌游戏的可判定性。本文的一个重要贡献是将基于动态规划的证明技术应用于不可数状态和动作空间上的平均报酬优化。
关键词
  • 定时自动机
  • Mean-Payoff游戏
  • 合成控制器

度量标准

工具书类

  1. R.Alur、M.Bernadsky和P.Madhusudan。加权计时游戏的最佳可达性。程序中。ICALP,第122-133页。斯普林格,2004年。谷歌学者
  2. R.Alur和D.Dill。时间自动机理论。理论计算机科学,126(2):183-2351994。谷歌学者
  3. E.Asarin和O.Maler。尽快:时间自动机的时间最优控制。F.W.Vaandrager和J.H.van Schuppen,编辑,Proc。HSCC第19-30页,1999年。谷歌学者
  4. H.Björklund、S.Sandberg和S.Vorobyov。均值支付博弈的组合强次指数策略改进算法。程序中。MFCS第673-685页,2004年。谷歌学者
  5. P.鲍耶。加权时间自动机:模型检查和游戏。程序中。MFPS,第158卷,第3-17页,2006年。谷歌学者
  6. P.Bouyer、T.Brihaye、M.Jurdzinski、R.Lazic和M.Rutkowski。具有强重置的混合自动机上的平均价格和可达价格游戏。以格式,LNCS第5215卷,第63-77页,2008年。谷歌学者
  7. P.Bouyer、E.Brinksma和K.G.Larsen。尽可能便宜地活着。程序中。HSCC第2993卷,LNCS,第203-218页。斯普林格,2004年。谷歌学者
  8. P.Bouyer、F.Cassez、E.Fleury和K.G.Larsen。定价时间博弈自动机中的最优策略。程序中。FSTTCS,LNCS第3328卷,第148-160页。斯普林格,2004年。谷歌学者
  9. P.Bouyer、K.G.Larsen和N.Markey。加权时间自动机中的下限约束运行。程序中。QEST第128-137页,2012年。网址:http://dx.doi.org/10.1109/QEST.2012.28.
  10. R.Brenguier、F.Cassez和J.F.Raskin。能量和平均值计时游戏。程序中。HSCC第283-292页,2014年。网址:http://dx.doi.org/10.1145/2562059.2562116.
  11. T.Brihaye、G.Geeraerts、S.N.Krishna、L.Manasa、B.Monmege和A.Trivedi。为定价的定时游戏增加负价格。程序中。CONCUR,第560-575页,2014年。谷歌学者
  12. E.Dynkin和A.Yushkevich。受控马尔可夫过程。施普林格,1979年。谷歌学者
  13. A.Ehrenfeucht和A.Mycielski。平均回报博弈的位置策略。《国际博弈论杂志》,8:109-1131979。谷歌学者
  14. J.Filar和K.Vrieze。竞争马尔可夫决策过程。施普林格,1997年。谷歌学者
  15. S.Guha、M.Jurdziánski、S.N.Krishna和A.Trivedi。时间自动机上的均值支付博弈。CoRR,abs/1607.084802016年。网址:http://arxiv.org/abs/1607.08480.
  16. V.A.Gurvich、A.V.Karzanov和L.G.Khachiyan。循环对策和在有向图中寻找极小极大循环均值的算法。苏联计算数学和数学物理,28:85-911988。谷歌学者
  17. 托马斯·汉津格(Thomas A.Henzinger)。定量反应建模和验证。计算机科学-研究与开发,28(4):331-3442013。谷歌学者
  18. R.A.霍华德。动态规划和马尔可夫过程。麻省理工学院出版社,1960年。谷歌学者
  19. M.Jurdziánski和A.Trivedi。时间自动机上的可达时间游戏。程序中。ICALP,第838-849页。施普林格,2007年。谷歌学者
  20. M.Jurdziánski和A.Trivedi。平均时间游戏。R.Hariharan、M.Mukund和V.Vinay,编辑,Proc。FSTTCS,Dagstuhl研讨会论文集,2008年。谷歌学者
  21. M.L.Puterman先生。马尔可夫决策过程:光盘。斯托克。动态程序。威利,1994年。谷歌学者
  22. P.J.Ramadge和W.M.Wonham。离散事件系统的控制。IEEE,第77卷,第81-98页,1989年。谷歌学者
  23. A.特里维迪。时间自动机的竞争优化。华威大学计算机科学系博士论文,2009年。谷歌学者
  24. U.Zwick和M.Paterson。图上平均收益博弈的复杂性。理论计算机科学,158:343-3591996。谷歌学者
问题/备注/反馈
X(X)

Dagstuhl出版社反馈


感谢您的反馈!

已提交反馈

无法发送消息

请稍后再试或发送电子邮件