研究论文

开放式访问

广义可达性随机对策的近似值

作者：
普拉纳夫·阿肖克

德国慕尼黑技术大学

德国慕尼黑工业大学
查看个人资料

,
克里希南德·查特吉

IST奥地利

IST奥地利
查看个人资料

,
简·K·埃因斯克

德国慕尼黑技术大学

德国慕尼黑技术大学
查看个人资料

,
马克西米利安·魏宁格

德国慕尼黑技术大学

德国慕尼黑技术大学
查看个人资料

,
托比亚斯·温克勒

德国亚琛RWTH大学

德国亚琛RWTH大学
查看个人资料

作者信息和声明

LICS’20：第35届ACM/IEEE计算机科学逻辑年会论文集2020年7月第102–115页https://doi.org/10.1145/3373718.3394761

出版：2020年7月8日出版历史

LICS’20：第35届ACM/IEEE计算机科学逻辑年会论文集

第102–115页

摘要

简单随机游戏是基于回合的2½人游戏，具有可达性目标。基本问题是，一个玩家是否能够确保至少以给定的概率达到给定的目标。一个自然的延伸是与客观条件相结合的博弈。尽管最近有大量关于多目标系统分析的结果，但这一基本问题的可判定性仍然悬而未决。在本文中，我们提出了一种将可实现值的Pareto边界近似到给定精度的算法。此外，它是一种随时可用的算法，这意味着它可以在任何时候停止，返回当前近似值及其误差范围。

工具书类

Rajeev Alur和David L.Dill。1994.时间自动机理论。西奥。计算。科学。126, 2 (1994), 183--235.谷歌学者数字图书馆
Pranav Ashok、Krishnendu Chatterjee、Przemyslaw Daca、Jan Kretínsk和Tobias Meggendorfer。2017.马尔可夫决策过程中长期平均回报的价值迭代。在CAV中。201--221. https://doi.org/10.1007/978-3-319-63387-9_10谷歌学者
Pranav Ashok、Krishnendu Chatterjee、Jan Kretinsky、Maximilian Weininger和Tobias Winkler。2020年广义可达性随机博弈的近似值。CoRR abs/1908.05106（2020）。谷歌学者
克里斯特尔·拜尔（Christel Baier）、马库斯·达姆（Marcus Daum）、克莱门斯·杜斯拉夫（Clemens Dubslaff）、约阿希姆·克莱恩（Joachim Klein）和萨沙·克鲁珀霍尔茨（Sascha Klüppelholz）。2014.能源公用事业数量。在NASA正式方法中。285--299.谷歌学者
克里斯特尔·拜尔（Christel Baier）、克莱门斯·杜斯拉夫（Clemens Dubslaff）和萨沙·克吕佩尔霍尔茨（Sascha Klüppelholz）。2014年。权衡分析符合概率模型检查。在CSL-LICS中。1:1--1:10.谷歌学者
克里斯特尔·拜尔、克莱门斯·杜斯拉夫、萨沙·克鲁珀霍尔茨、马库斯·达姆、约阿希姆·克莱因、斯特芬·梅克尔和萨沙·温德利希。2014.概率模型检查和非标准多目标推理。在FASE中。1--16.谷歌学者
克里斯特尔·拜尔（Christel Baier）和朱斯特·佩特尔·卡托恩（Joost-Pieter Katoen）。2008.模型检查原则。谷歌学者
尼古拉斯·巴塞特（Nicolas Basset）、玛尔塔·奎亚特科夫斯卡（Marta Z.Kwiatkowska）、乌夫克·托普库（Ufuk Topcu）和克莱门斯·威尔特切（Clemens Wiltsche）。2015.具有多个长期目标的随机游戏的策略综合。在TACAS（计算机科学讲义），第9035卷。施普林格，256-271。谷歌学者
尼古拉斯·巴塞特（Nicolas Basset）、玛尔塔·奎亚特科夫斯卡（Marta Z.Kwiatkowska）和克莱门斯·威尔特切（Clemens Wiltsche）。2018.多目标随机博弈的合成策略综合。Inf.计算。261，第（2018）部分，536--587。谷歌学者
Tomás Brázdil、Václav Brozek、Krishnendu Chatterjee、Vojtech Forejt和Antonín Kucera。2014.关于马尔可夫决策过程中多重平均回报目标的两种观点。LMCS 10，1（2014）。https://doi.org/10.2168/LMCS-10(1:13)2014谷歌学者
Tomás Brázdil、Krishnendu Chatterjee、Martin Chmelik、Vojtech Forejt、Jan Kretínský、Marta Z.Kwiatkowska、David Parker和Mateusz Ujma。2014.使用学习算法验证马尔可夫决策过程。ATVA（计算机科学讲义），第8837卷。施普林格，98-114。谷歌学者
Tomás Brázdil、Krishnendu Chatterjee、Vojtech Forejt和Antonín Kucera。2013年，马尔可夫决策过程稳定性的交易表现。在LICS中。331--340.谷歌学者
Romain Brenguier和Vojtech Forejt。2016。多目标随机博弈的可决策性结果。ATVA（计算机科学讲义），第9938卷。227--243.谷歌学者交叉引用
罗曼·布伦吉尔（Romain Brenguier）和珍妮·弗兰索瓦·拉斯金（Jean-François Raskin）。2015年，多维平均回报游戏的帕累托曲线。在CAV（2）（计算机科学讲义），第9207卷。施普林格，251-267。谷歌学者
克里希南德·查特吉。2007.具有多个长期平均目标的马尔可夫决策过程。FSTTCS（计算机科学讲义），第4855卷。施普林格，473-484。谷歌学者
Krishnendu Chatterjee和Laurent Doyen。2016.具有广义平均回报目标的完美信息随机游戏。在LICS中。美国医学会，247--256。谷歌学者
克里希南德·查特吉和纳塔娜·菲亚尔科夫。2011年，从平价游戏减少到简单随机游戏。在甘道夫。74--86. https://doi.org/10.4204/EPTCS.54.6谷歌学者
Krishnendu Chatterjee、Vojtech Forejt和Dominik Wojtczak。2013年，图和MDP中的多目标折扣奖励验证。在LPAR中。228--242.谷歌学者
克里希南德·查特吉（Krishnendu Chatterjee）和托马斯·亨廷格（Thomas A Henzinger）。2008年。价值迭代。在25年的模型检查中。施普林格，107--138。谷歌学者
Krishnendu Chatterjee、Thomas A.Henzinger、Barbara Jobstmann和Arjun Radhakrishna。2010年。要点：概率游戏的求解器。在CAV中。665年至669年。https://doi.org/10.1007/978-3642-14295-6_57谷歌学者
克里希南德·查特吉（Krishnendu Chatterjee）、祖扎娜·克伦斯卡（Zuzana Kretínská）和扬·克伦斯克（Jan Kretánsk）。2017年，统一马尔可夫决策过程中关于多重平均收益目标的两种观点。《计算机科学中的逻辑方法》13，2（2017）。谷歌学者
Taolue Chen、Vojtech Forejt、Marta Z.Kwiatkowska、David Parker和Aistis Simaitis。2013.PRISM-games:随机多人游戏的模型检查器。在TACAS（计算机科学讲义），第7795卷。施普林格，185-191。谷歌学者
Taolue Chen、Vojtech Forejt、Marta Z.Kwiatkowska、Aistis Simaitis和Clemens Wiltsche。2013.关于多目标随机游戏。MFCS（计算机科学讲义），第8087卷。施普林格，266--277。谷歌学者
Taolue Chen、Vojtech Forejt、Marta Z.Kwiatkowska、Aistis Simaitis和Clemens Wiltsche。2013.关于多目标随机游戏。技术报告。266至277页。谷歌学者
Taolue Chen、Marta Z.Kwiatkowska、Aistis Simaitis和Clemens Wiltsche。2013年，《多目标随机游戏综合：城市自主驾驶应用》。在QEST中。322--337. https://doi.org/10.1007/978-3-642-40196-1_28谷歌学者
Chih-Hong Cheng、Alois Knoll、Michael Luttenberger和Christian Buckl。2011年，GAVS+：算法游戏解决研究的开放平台。在ETAPS中。258--261. https://doi.org/10.1007/978-3-642-19835-9_22谷歌学者
安妮·康登。1992.随机博弈的复杂性。信息与计算96，2（1992），203--224。谷歌学者数字图书馆
安妮·康登。1993年。关于简单随机游戏的算法。《计算复杂性理论进展》，离散数学和理论计算机科学DIMACS系列第13卷。美国数学学会，51-73。谷歌学者
科斯塔斯·库库贝蒂斯和米哈利斯·扬纳卡基斯。1995.概率验证的复杂性。J.ACM 42，4（1995年7月），857--907。谷歌学者数字图书馆
库沙·埃特萨米（Kousha Etessami）、玛尔塔·奎亚特·科夫斯卡（Marta Z.Kwiatkowska）、莫舍·瓦尔迪（Moshe Y.Vardi）和米哈利斯·扬纳卡基斯（Mihalis Yannakakakis）。2008。马尔可夫决策过程的多目标模型检查。计算机科学中的逻辑方法4，4（2008）。谷歌学者
J.A.Filar、D.Krass和K.W Ross。1995.限制平均马尔可夫决策过程的百分位性能标准。《自动控制》，IEEE汇刊，第40期，第1期（1995年1月），第2-10页。谷歌学者交叉引用
Vojtech Forejt、Marta Z.Kwiatkowska、Gethin Norman、David Parker和Hongyang Qu.2011年。概率系统的定量多目标验证。在TACAS中。112--127. https://doi.org/10.1007/978-3-642-19835-9_11谷歌学者
Vojtech Forejt、Marta Z.Kwiatkowska和David Parker。2012.概率模型检查的帕累托曲线。ATVA（计算机科学讲义），第7561卷。施普林格，317-332。谷歌学者
Christoph Haase、Stefan Kiefer和Markus Lohrey。2017.使用多维成本计算马尔可夫链中的分位数。在LICS中。1--12.谷歌学者
谢尔盖·哈达德和本杰明·蒙梅格。2018年，MDP和IMDP的区间迭代算法。西奥。计算。科学。735 (2018), 111--131.谷歌学者交叉引用
A.海彻。2002.代数拓扑。剑桥大学出版社。https://books.google.de/books？id=BjKs86kosqgC谷歌学者
Edon Kelmendi、Julia Krämer、Jan Kretínsk和Maximilian Weininger。2018.简单随机游戏的值迭代：停止标准和学习算法。在CAV中。https://doi.org/10.1007/978-3-319-96145-3_36谷歌学者
玛尔塔·奎亚特科夫斯卡、大卫·帕克和克莱门斯·威尔奇。2016年，PRISM-Games 2.0：随机游戏多目标策略合成工具。在TACAS（计算机科学讲义），第9636卷。斯普林格，560-566。谷歌学者
玛尔塔·奎亚特科夫斯卡、大卫·帕克和克莱门斯·威尔奇。2018年。PRISM-games:多目标随机多层游戏的验证和策略合成。STTT 20，2（2018），195-210。谷歌学者数字图书馆
Marta Z.Kwiatkowska、Gethin Norman和David Parker。2011年，PRISM 4.0：概率实时系统验证。在CAV（计算机科学讲义），第6806卷。施普林格，585--591。谷歌学者
H.Brendan Mcmahan、Maxim Likhachev和Geoffrey J.Gordon。2005.有界实时动态编程：具有单调上界和性能保证的RTDP。在ICML 05中。569--576.谷歌学者
Christos H.Papadimitriou和Mihalis Yannakakis。2000.关于交易的近似性和Web资源的最佳访问。在FOCS中。IEEE计算机学会，86-92。谷歌学者
马丁·普特曼。2014.马尔可夫决策过程：离散随机动态规划。约翰·威利父子公司。谷歌学者
米凯尔·兰德尔（Mickael Randour）、珍妮·弗兰索瓦·拉斯金（Jean-François Raskin）和奥坎·桑库尔（Ocan Sankur）。2015。多维马尔可夫决策过程中的百分比查询。在CAV（1）（计算机科学课堂讲稿），第9206卷。施普林格，123-139。谷歌学者
米凯尔·兰德尔（Mickael Randour）、珍妮·弗兰索瓦·拉斯金（Jean-François Raskin）和奥坎·桑库尔（Ocan Sankur）。2017.多维马尔可夫决策过程中的百分比查询。系统设计中的形式化方法50，2-3（2017），207-248。https://doi.org/10.1007/s10703-016-0262-7谷歌学者数字图书馆
玛丽亚·斯沃伦诺娃（Maria Svorenová）和玛塔·奎亚特科夫斯卡（Marta Kwiatkowska）。2016.随机游戏的定量验证和策略合成。《欧洲期刊控制》30（2016），15-30。https://doi.org/10.1016/j.ejcon.2016.04.009谷歌学者交叉引用
亚伦·维纳（Yaron Velner）。2015年，稳健的多维Mean-Payoff游戏无法确定。在FoSSaCS中。施普林格，312--327。谷歌学者

索引术语

广义可达性随机对策的近似值
1. 计算数学
  1. 概率与统计
2. 计算理论
  1. 逻辑
    1. 通过模型检查进行验证
  2. 应用领域的理论和算法
    1. 算法博弈理论与机制设计
      1. 算法博弈论

建议

并发可达性和基于turn的随机安全对策的策略改进

我们考虑在图上进行并发游戏。在游戏的每一轮中，每个玩家同时独立地选择一个动作；这些举措共同决定了向继承国的过渡。两个基本目标是保持。。。
阅读更多信息
部分观测随机奇偶博弈综述

我们考虑具有 -规定为对等目标的常规获胜条件。这些游戏在反应系统的设计和控制中有应用。我们调查了…问题的复杂性结果。。。
阅读更多信息
并发可达性游戏

我们考虑具有可达性目标的并发两层博弈。在这样的游戏中，在每一轮中，玩家1和玩家2分别同时选择动作，这两个选择决定游戏的下一个状态。玩家1的目标。。。
阅读更多信息

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

完全访问权限

获取此出版物

发布于
LICS’20：第35届ACM/IEEE计算机科学逻辑年度研讨会论文集
2020年7月
986页
国际标准图书编号：9781450371049
内政部：10.1145/3373718
会议主席：
霍尔格·赫尔曼斯,
张丽君,
小林直树,
总主席：
戴尔·米勒
版权所有©2020所有者/作者
本作品根据Creative Commons Attribution International 4.0许可证授权。
赞助商
合作中
出版商
计算机协会
美国纽约州纽约市
出版历史
- 出版：2020年7月8日
检查更新
作者标记
任意时间算法
多个可达性目标
帕累托边界
随机博弈
限定符
- 研究论文
- 研究
- 推荐有限公司
会议

接受率
LICS’20纸张接受率69属于174提交文件，40%总体验收率143属于386提交文件，37%
更多
资金来源
其他指标
查看文章指标

文章指标
- 10
  引文总数
  查看引文
- 485
  总下载次数
- 下载次数（过去12个月）170
- 下载次数（最近6周）11
其他指标
查看作者指标
引用人
查看全部

PDF格式

以PDF文件查看或下载。

PDF格式

电子阅读器

使用eReader联机查看。

电子阅读器

广义可达性随机对策的近似值

LICS’20：第35届ACM/IEEE计算机科学逻辑年会论文集

摘要

工具书类

引用人

索引术语

建议

并发可达性和基于turn的随机安全对策的策略改进

部分观测随机奇偶博弈综述

并发可达性游戏

评论

登录选项

完全访问权限

发布于

赞助商

合作中

出版商

出版历史

检查更新

作者标记

限定符

会议

接受率

资金来源

其他指标

文章指标

其他指标

引用人

PDF格式

电子阅读器

数字版

解说词

广义可达性随机对策的近似值

LICS’20：第35届ACM/IEEE计算机科学逻辑年会论文集

摘要

工具书类

引用人

索引术语

建议

并发可达性和基于turn的随机安全对策的策略改进

部分观测随机奇偶博弈综述

并发可达性游戏

评论

登录选项

完全访问权限

发布于

赞助商

合作中

出版商

出版历史

检查更新

作者标记

限定符

会议

接受率

资金来源

文章指标

其他指标

PDF格式

电子阅读器

数字版

共享此出版物链接

在社交媒体上分享