跳到主要内容
10.1145/3373718.3394761acm会议文章/章节视图摘要出版物页面低收入国家会议记录会议集合
研究论文
开放式访问

广义可达性随机对策的近似值

出版:2020年7月8日出版历史

摘要

简单随机游戏是基于回合的2½人游戏,具有可达性目标。基本问题是,一个玩家是否能够确保至少以给定的概率达到给定的目标。一个自然的延伸是与客观条件相结合的博弈。尽管最近有大量关于多目标系统分析的结果,但这一基本问题的可判定性仍然悬而未决。在本文中,我们提出了一种将可实现值的Pareto边界近似到给定精度的算法。此外,它是一种随时可用的算法,这意味着它可以在任何时候停止,返回当前近似值及其误差范围。

工具书类

  1. Rajeev Alur和David L.Dill。1994.时间自动机理论。西奥。计算。科学。126, 2 (1994), 183--235.谷歌学者谷歌学者数字图书馆数字图书馆
  2. Pranav Ashok、Krishnendu Chatterjee、Przemyslaw Daca、Jan Kretínsk和Tobias Meggendorfer。2017.马尔可夫决策过程中长期平均回报的价值迭代。在CAV中。201--221. https://doi.org/10.1007/978-3-319-63387-9_10谷歌学者谷歌学者
  3. Pranav Ashok、Krishnendu Chatterjee、Jan Kretinsky、Maximilian Weininger和Tobias Winkler。2020年广义可达性随机博弈的近似值。CoRR abs/1908.05106(2020)。谷歌学者谷歌学者
  4. 克里斯特尔·拜尔(Christel Baier)、马库斯·达姆(Marcus Daum)、克莱门斯·杜斯拉夫(Clemens Dubslaff)、约阿希姆·克莱恩(Joachim Klein)和萨沙·克鲁珀霍尔茨(Sascha Klüppelholz)。2014.能源公用事业数量。在NASA正式方法中。285--299.谷歌学者谷歌学者
  5. 克里斯特尔·拜尔(Christel Baier)、克莱门斯·杜斯拉夫(Clemens Dubslaff)和萨沙·克吕佩尔霍尔茨(Sascha Klüppelholz)。2014年。权衡分析符合概率模型检查。在CSL-LICS中。1:1--1:10.谷歌学者谷歌学者
  6. 克里斯特尔·拜尔、克莱门斯·杜斯拉夫、萨沙·克鲁珀霍尔茨、马库斯·达姆、约阿希姆·克莱因、斯特芬·梅克尔和萨沙·温德利希。2014.概率模型检查和非标准多目标推理。在FASE中。1--16.谷歌学者谷歌学者
  7. 克里斯特尔·拜尔(Christel Baier)和朱斯特·佩特尔·卡托恩(Joost-Pieter Katoen)。2008.模型检查原则。谷歌学者谷歌学者
  8. 尼古拉斯·巴塞特(Nicolas Basset)、玛尔塔·奎亚特科夫斯卡(Marta Z.Kwiatkowska)、乌夫克·托普库(Ufuk Topcu)和克莱门斯·威尔特切(Clemens Wiltsche)。2015.具有多个长期目标的随机游戏的策略综合。在TACAS(计算机科学讲义),第9035卷。施普林格,256-271。谷歌学者谷歌学者
  9. 尼古拉斯·巴塞特(Nicolas Basset)、玛尔塔·奎亚特科夫斯卡(Marta Z.Kwiatkowska)和克莱门斯·威尔特切(Clemens Wiltsche)。2018.多目标随机博弈的合成策略综合。Inf.计算。261,第(2018)部分,536--587。谷歌学者谷歌学者
  10. Tomás Brázdil、Václav Brozek、Krishnendu Chatterjee、Vojtech Forejt和Antonín Kucera。2014.关于马尔可夫决策过程中多重平均回报目标的两种观点。LMCS 10,1(2014)。https://doi.org/10.2168/LMCS-10(1:13)2014谷歌学者谷歌学者
  11. Tomás Brázdil、Krishnendu Chatterjee、Martin Chmelik、Vojtech Forejt、Jan Kretínský、Marta Z.Kwiatkowska、David Parker和Mateusz Ujma。2014.使用学习算法验证马尔可夫决策过程。ATVA(计算机科学讲义),第8837卷。施普林格,98-114。谷歌学者谷歌学者
  12. Tomás Brázdil、Krishnendu Chatterjee、Vojtech Forejt和Antonín Kucera。2013年,马尔可夫决策过程稳定性的交易表现。在LICS中。331--340.谷歌学者谷歌学者
  13. Romain Brenguier和Vojtech Forejt。2016。多目标随机博弈的可决策性结果。ATVA(计算机科学讲义),第9938卷。227--243.谷歌学者谷歌学者交叉引用交叉引用
  14. 罗曼·布伦吉尔(Romain Brenguier)和珍妮·弗兰索瓦·拉斯金(Jean-François Raskin)。2015年,多维平均回报游戏的帕累托曲线。在CAV(2)(计算机科学讲义),第9207卷。施普林格,251-267。谷歌学者谷歌学者
  15. 克里希南德·查特吉。2007.具有多个长期平均目标的马尔可夫决策过程。FSTTCS(计算机科学讲义),第4855卷。施普林格,473-484。谷歌学者谷歌学者
  16. Krishnendu Chatterjee和Laurent Doyen。2016.具有广义平均回报目标的完美信息随机游戏。在LICS中。美国医学会,247--256。谷歌学者谷歌学者
  17. 克里希南德·查特吉和纳塔娜·菲亚尔科夫。2011年,从平价游戏减少到简单随机游戏。在甘道夫。74--86. https://doi.org/10.4204/EPTCS.54.6谷歌学者谷歌学者
  18. Krishnendu Chatterjee、Vojtech Forejt和Dominik Wojtczak。2013年,图和MDP中的多目标折扣奖励验证。在LPAR中。228--242.谷歌学者谷歌学者
  19. 克里希南德·查特吉(Krishnendu Chatterjee)和托马斯·亨廷格(Thomas A Henzinger)。2008年。价值迭代。在25年的模型检查中。施普林格,107--138。谷歌学者谷歌学者
  20. Krishnendu Chatterjee、Thomas A.Henzinger、Barbara Jobstmann和Arjun Radhakrishna。2010年。要点:概率游戏的求解器。在CAV中。665年至669年。https://doi.org/10.1007/978-3642-14295-6_57谷歌学者谷歌学者
  21. 克里希南德·查特吉(Krishnendu Chatterjee)、祖扎娜·克伦斯卡(Zuzana Kretínská)和扬·克伦斯克(Jan Kretánsk)。2017年,统一马尔可夫决策过程中关于多重平均收益目标的两种观点。《计算机科学中的逻辑方法》13,2(2017)。谷歌学者谷歌学者
  22. Taolue Chen、Vojtech Forejt、Marta Z.Kwiatkowska、David Parker和Aistis Simaitis。2013.PRISM-games:随机多人游戏的模型检查器。在TACAS(计算机科学讲义),第7795卷。施普林格,185-191。谷歌学者谷歌学者
  23. Taolue Chen、Vojtech Forejt、Marta Z.Kwiatkowska、Aistis Simaitis和Clemens Wiltsche。2013.关于多目标随机游戏。MFCS(计算机科学讲义),第8087卷。施普林格,266--277。谷歌学者谷歌学者
  24. Taolue Chen、Vojtech Forejt、Marta Z.Kwiatkowska、Aistis Simaitis和Clemens Wiltsche。2013.关于多目标随机游戏。技术报告。266至277页。谷歌学者谷歌学者
  25. Taolue Chen、Marta Z.Kwiatkowska、Aistis Simaitis和Clemens Wiltsche。2013年,《多目标随机游戏综合:城市自主驾驶应用》。在QEST中。322--337. https://doi.org/10.1007/978-3-642-40196-1_28谷歌学者谷歌学者
  26. Chih-Hong Cheng、Alois Knoll、Michael Luttenberger和Christian Buckl。2011年,GAVS+:算法游戏解决研究的开放平台。在ETAPS中。258--261. https://doi.org/10.1007/978-3-642-19835-9_22谷歌学者谷歌学者
  27. 安妮·康登。1992.随机博弈的复杂性。信息与计算96,2(1992),203--224。谷歌学者谷歌学者数字图书馆数字图书馆
  28. 安妮·康登。1993年。关于简单随机游戏的算法。《计算复杂性理论进展》,离散数学和理论计算机科学DIMACS系列第13卷。美国数学学会,51-73。谷歌学者谷歌学者
  29. 科斯塔斯·库库贝蒂斯和米哈利斯·扬纳卡基斯。1995.概率验证的复杂性。J.ACM 42,4(1995年7月),857--907。谷歌学者谷歌学者数字图书馆数字图书馆
  30. 库沙·埃特萨米(Kousha Etessami)、玛尔塔·奎亚特·科夫斯卡(Marta Z.Kwiatkowska)、莫舍·瓦尔迪(Moshe Y.Vardi)和米哈利斯·扬纳卡基斯(Mihalis Yannakakakis)。2008。马尔可夫决策过程的多目标模型检查。计算机科学中的逻辑方法4,4(2008)。谷歌学者谷歌学者
  31. J.A.Filar、D.Krass和K.W Ross。1995.限制平均马尔可夫决策过程的百分位性能标准。《自动控制》,IEEE汇刊,第40期,第1期(1995年1月),第2-10页。谷歌学者谷歌学者交叉引用交叉引用
  32. Vojtech Forejt、Marta Z.Kwiatkowska、Gethin Norman、David Parker和Hongyang Qu.2011年。概率系统的定量多目标验证。在TACAS中。112--127. https://doi.org/10.1007/978-3-642-19835-9_11谷歌学者谷歌学者
  33. Vojtech Forejt、Marta Z.Kwiatkowska和David Parker。2012.概率模型检查的帕累托曲线。ATVA(计算机科学讲义),第7561卷。施普林格,317-332。谷歌学者谷歌学者
  34. Christoph Haase、Stefan Kiefer和Markus Lohrey。2017.使用多维成本计算马尔可夫链中的分位数。在LICS中。1--12.谷歌学者谷歌学者
  35. 谢尔盖·哈达德和本杰明·蒙梅格。2018年,MDP和IMDP的区间迭代算法。西奥。计算。科学。735 (2018), 111--131.谷歌学者谷歌学者交叉引用交叉引用
  36. A.海彻。2002.代数拓扑。剑桥大学出版社。https://books.google.de/books?id=BjKs86kosqgC谷歌学者谷歌学者
  37. Edon Kelmendi、Julia Krämer、Jan Kretínsk和Maximilian Weininger。2018.简单随机游戏的值迭代:停止标准和学习算法。在CAV中。https://doi.org/10.1007/978-3-319-96145-3_36谷歌学者谷歌学者
  38. 玛尔塔·奎亚特科夫斯卡、大卫·帕克和克莱门斯·威尔奇。2016年,PRISM-Games 2.0:随机游戏多目标策略合成工具。在TACAS(计算机科学讲义),第9636卷。斯普林格,560-566。谷歌学者谷歌学者
  39. 玛尔塔·奎亚特科夫斯卡、大卫·帕克和克莱门斯·威尔奇。2018年。PRISM-games:多目标随机多层游戏的验证和策略合成。STTT 20,2(2018),195-210。谷歌学者谷歌学者数字图书馆数字图书馆
  40. Marta Z.Kwiatkowska、Gethin Norman和David Parker。2011年,PRISM 4.0:概率实时系统验证。在CAV(计算机科学讲义),第6806卷。施普林格,585--591。谷歌学者谷歌学者
  41. H.Brendan Mcmahan、Maxim Likhachev和Geoffrey J.Gordon。2005.有界实时动态编程:具有单调上界和性能保证的RTDP。在ICML 05中。569--576.谷歌学者谷歌学者
  42. Christos H.Papadimitriou和Mihalis Yannakakis。2000.关于交易的近似性和Web资源的最佳访问。在FOCS中。IEEE计算机学会,86-92。谷歌学者谷歌学者
  43. 马丁·普特曼。2014.马尔可夫决策过程:离散随机动态规划。约翰·威利父子公司。谷歌学者谷歌学者
  44. 米凯尔·兰德尔(Mickael Randour)、珍妮·弗兰索瓦·拉斯金(Jean-François Raskin)和奥坎·桑库尔(Ocan Sankur)。2015。多维马尔可夫决策过程中的百分比查询。在CAV(1)(计算机科学课堂讲稿),第9206卷。施普林格,123-139。谷歌学者谷歌学者
  45. 米凯尔·兰德尔(Mickael Randour)、珍妮·弗兰索瓦·拉斯金(Jean-François Raskin)和奥坎·桑库尔(Ocan Sankur)。2017.多维马尔可夫决策过程中的百分比查询。系统设计中的形式化方法50,2-3(2017),207-248。https://doi.org/10.1007/s10703-016-0262-7谷歌学者谷歌学者数字图书馆数字图书馆
  46. 玛丽亚·斯沃伦诺娃(Maria Svorenová)和玛塔·奎亚特科夫斯卡(Marta Kwiatkowska)。2016.随机游戏的定量验证和策略合成。《欧洲期刊控制》30(2016),15-30。https://doi.org/10.1016/j.ejcon.2016.04.009谷歌学者谷歌学者交叉引用交叉引用
  47. 亚伦·维纳(Yaron Velner)。2015年,稳健的多维Mean-Payoff游戏无法确定。在FoSSaCS中。施普林格,312--327。谷歌学者谷歌学者

索引术语

  1. 广义可达性随机对策的近似值

        建议

        评论

        登录选项

        检查您是否可以通过登录凭据或您的机构访问本文。

        登录

        完全访问权限

        • 发布于

          封面图片ACM会议
          LICS’20:第35届ACM/IEEE计算机科学逻辑年度研讨会论文集
          2020年7月
          986页
          国际标准图书编号:9781450371049
          内政部:10.1145/3373718

          版权所有©2020所有者/作者

          本作品根据Creative Commons Attribution International 4.0许可证授权。

          出版商

          计算机协会

          美国纽约州纽约市

          出版历史

          • 出版:2020年7月8日

          检查更新

          限定符

          • 研究论文
          • 研究
          • 推荐有限公司

          接受率

          LICS’20纸张接受率69属于174提交文件,40%总体验收率143属于386提交文件,37%

        PDF格式

        以PDF文件查看或下载。

        PDF格式

        电子阅读器

        使用eReader联机查看。

        电子阅读器