Mean-Payoff Games on Timed Automata

Guha, Shibashis; Jurdzinski, Marcin; Krishna, Shankara Narayanan; Trivedi, Ashutosh

doi:10.4230/LIPIcs.FSTTCS.2016.44

时间自动机上的Mean-Payoff游戏

作者详细信息

什巴希斯·古哈

马金·尤金斯基（Marcin Jurdzinski）

桑卡拉·纳拉亚南·克里希纳

阿什图什·特里维迪

引用为获取BibTex

Shibashis Guha、Marcin Jurdzinski、Shankara Narayanan Krishna和Ashutosh Trivedi。定时自动机上的Mean-Payoff游戏。第36届IARCS软件技术和理论计算机科学基础年会（FSTTCS 2016）。莱布尼茨国际信息学论文集（LIPIcs），第65卷，第44:1-44:14页，达格斯图尔-莱布尼兹-泽特鲁姆信息学院（2016）
https://doi.org/10.4230/LIPIcs.FSTTCS.2016.44

@会议记录{guha_et_al:LIPIcs.FSTTCS.2016.44，作者={Guha、Shibashis和Jurdzinski、Marcin和Krishna、Shankara Narayanan和Trivedi、Ashutosh}，title={{定时自动机上的Mean-Payoff游戏}}，booktitle={第36届IARCS软件技术与理论计算机科学基础年会（FSTTCS 2016）}，页数={44:1--44:14}，series={Leibniz国际信息学论文集（LIPIcs）}，国际标准图书编号={978-3-95977-027-9}，ISSN={1868-8969}，年份＝{2016}，体积={65}，editor={Lal，Akash and Akshay，S.和Saurabh，Saket and Sen，Sandeep}，publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik}，地址={Dagstuhl，德国}，URL={https://drops-dev.dagstuhl.de/entities/document/10.4230/LIPIcs.FSTTCS.2016.44},URN={URN:nbn:de:0030-drops-68797}，doi={10.4230/LIPIcs.FSTTCS.2016.44}，annote={关键词：时间自动机，平均回报游戏，控制器综合}}

<trans data-src="@InProceedings{guha_et_al:LIPIcs.FSTTCS.2016.44,">@会议记录{guha_et_al:LIPIcs.FSTTCS.2016.44，</trans><trans data-src="author =	{Guha, Shibashis and Jurdzinski, Marcin and Krishna, Shankara Narayanan and Trivedi, Ashutosh},">作者={Guha、Shibashis和Jurdzinski、Marcin和Krishna、Shankara Narayanan和Trivedi、Ashutosh}，</trans><trans data-src="title =	{{Mean-Payoff Games on Timed Automata}},">title={{定时自动机上的Mean-Payoff游戏}}，</trans><trans data-src="booktitle =	{36th IARCS Annual Conference on Foundations of Software Technology and Theoretical Computer Science (FSTTCS 2016)},">booktitle={第36届IARCS软件技术与理论计算机科学基础年会（FSTTCS 2016）}，</trans><trans data-src="pages =	{44:1--44:14},">页数={44:1--44:14}，</trans><trans data-src="series =	{Leibniz International Proceedings in Informatics (LIPIcs)},">series={Leibniz国际信息学论文集（LIPIcs）}，</trans><trans data-src="ISBN =	{978-3-95977-027-9},">国际标准图书编号={978-3-95977-027-9}，</trans><trans data-src="ISSN =	{1868-8969},">ISSN={1868-8969}，</trans><trans data-src="year =	{2016},">年份＝{2016}，</trans><trans data-src="volume =	{65},">体积={65}，</trans><trans data-src="editor =	{Lal, Akash and Akshay, S. and Saurabh, Saket and Sen, Sandeep},">editor={Lal，Akash and Akshay，S.和Saurabh，Saket and Sen，Sandeep}，</trans><trans data-src="publisher =	{Schloss Dagstuhl -- Leibniz-Zentrum f{\"u}r Informatik},">publisher={Schloss Dagstuhl--Leibniz Zentrum f{\“u}r Informatik}，</trans><trans data-src="address =	{Dagstuhl, Germany},">地址={Dagstuhl，德国}，</trans><trans data-src="URL =		{">URL={</trans><trans data-src="https://drops-dev.dagstuhl.de/entities/document/10.4230/LIPIcs.FSTTCS.2016.44">https://drops-dev.dagstuhl.de/enties/document/10.4230/LIPIcs.FSTTCS.2016.44</trans><trans data-src="},">},</trans><trans data-src="URN =		{urn:nbn:de:0030-drops-68797},">URN={URN:nbn:de:0030-drops-68797}，</trans><trans data-src="doi =		{10.4230/LIPIcs.FSTTCS.2016.44},">doi={10.4230/LIPIcs.FSTTCS.2016.44}，</trans><trans data-src="annote =	{Keywords: Timed Automata, Mean-Payoff Games, Controller-Synthesis}">annote={关键词：时间自动机，平均回报游戏，控制器综合}</trans><trans data-src="}">}</trans>

摘要

时间自动机上的平均回报游戏在定价时间自动机配置的无限加权图上进行，在两个玩家（玩家最小和玩家最大）之间进行，方法是沿着图的状态移动一个标记以形成无限运行。“球员最小”的目标是最小化跑步的极限平均重量，而“球员最大”的目标则相反。Brenguier、Cassez和Raskin最近研究了这些游戏的一种变体，并表明对于具有五个或更多时钟的时间自动机来说，平均值游戏是不可判定的。我们通过证明三个时钟的平均对弈游戏的不可判定性来改进这个结果。从积极的方面来看，我们证明了在具有二进制价格比率的单时钟时间自动机上的平均对赌游戏的可判定性。本文的一个重要贡献是将基于动态规划的证明技术应用于不可数状态和动作空间上的平均报酬优化。

工具书类

R.Alur、M.Bernadsky和P.Madhusudan。加权计时游戏的最佳可达性。程序中。ICALP，第122-133页。斯普林格，2004年。
R.Alur和D.Dill。时间自动机理论。理论计算机科学，126（2）：183-2351994。
E.Asarin和O.Maler。尽快：时间自动机的时间最优控制。F.W.Vaandrager和J.H.van Schuppen，编辑，Proc。HSCC第19-30页，1999年。
H.Björklund、S.Sandberg和S.Vorobyov。均值支付博弈的组合强次指数策略改进算法。程序中。MFCS第673-685页，2004年。
P.鲍耶。加权时间自动机：模型检查和游戏。程序中。MFPS，第158卷，第3-17页，2006年。
P.Bouyer、T.Brihaye、M.Jurdzinski、R.Lazic和M.Rutkowski。具有强重置的混合自动机上的平均价格和可达价格游戏。以格式，LNCS第5215卷，第63-77页，2008年。
P.Bouyer、E.Brinksma和K.G.Larsen。尽可能便宜地活着。程序中。HSCC第2993卷，LNCS，第203-218页。斯普林格，2004年。
P.Bouyer、F.Cassez、E.Fleury和K.G.Larsen。定价时间博弈自动机中的最优策略。程序中。FSTTCS，LNCS第3328卷，第148-160页。斯普林格，2004年。
P.Bouyer、K.G.Larsen和N.Markey。加权时间自动机中的下限约束运行。程序中。QEST第128-137页，2012年。网址：http://dx.doi.org/10.1109/QEST.2012.28.
R.Brenguier、F.Cassez和J.F.Raskin。能量和平均值计时游戏。程序中。HSCC第283-292页，2014年。网址：http://dx.doi.org/10.1145/2562059.2562116.
T.Brihaye、G.Geeraerts、S.N.Krishna、L.Manasa、B.Monmege和A.Trivedi。为定价的定时游戏增加负价格。程序中。CONCUR，第560-575页，2014年。
E.Dynkin和A.Yushkevich。受控马尔可夫过程。施普林格，1979年。
A.Ehrenfeucht和A.Mycielski。平均回报博弈的位置策略。《国际博弈论杂志》，8:109-1131979。
J.Filar和K.Vrieze。竞争马尔可夫决策过程。施普林格，1997年。
S.Guha、M.Jurdziánski、S.N.Krishna和A.Trivedi。时间自动机上的均值支付博弈。CoRR，abs/1607.084802016年。网址：http://arxiv.org/abs/1607.08480.
V.A.Gurvich、A.V.Karzanov和L.G.Khachiyan。循环对策和在有向图中寻找极小极大循环均值的算法。苏联计算数学和数学物理，28:85-911988。
托马斯·汉津格（Thomas A.Henzinger）。定量反应建模和验证。计算机科学-研究与开发，28（4）：331-3442013。
R.A.霍华德。动态规划和马尔可夫过程。麻省理工学院出版社，1960年。
M.Jurdziánski和A.Trivedi。时间自动机上的可达时间游戏。程序中。ICALP，第838-849页。施普林格，2007年。
M.Jurdziánski和A.Trivedi。平均时间游戏。R.Hariharan、M.Mukund和V.Vinay，编辑，Proc。FSTTCS，Dagstuhl研讨会论文集，2008年。
M.L.Puterman先生。马尔可夫决策过程：光盘。斯托克。动态程序。威利，1994年。
P.J.Ramadge和W.M.Wonham。离散事件系统的控制。IEEE，第77卷，第81-98页，1989年。
A.特里维迪。时间自动机的竞争优化。华威大学计算机科学系博士论文，2009年。
U.Zwick和M.Paterson。图上平均收益博弈的复杂性。理论计算机科学，158:343-3591996。

时间自动机上的Mean-Payoff游戏

作者什巴希斯·古哈, 马金·尤金斯基（Marcin Jurdzinski）, Shankara Narayanan Krishna, 阿什图什·特里维迪

文件

文件标识符

作者详细信息

引用为获取BibTex

摘要

关键词

度量标准

工具书类

感谢您的反馈！

无法发送消息

时间自动机上的Mean-Payoff游戏

作者 什巴希斯·古哈, 马金·尤金斯基（Marcin Jurdzinski）, Shankara Narayanan Krishna, 阿什图什·特里维迪

文件

文件标识符

作者详细信息

引用为获取BibTex

摘要

关键词

度量标准

工具书类

感谢您的反馈！

无法发送消息

作者什巴希斯·古哈, 马金·尤金斯基（Marcin Jurdzinski）, Shankara Narayanan Krishna, 阿什图什·特里维迪