摘要
Rajeev Alur和David L.Dill。 1994.时间自动机理论。 西奥。 计算。 科学。 126, 2 (1994), 183--235. 谷歌学者 数字图书馆 Pranav Ashok、Krishnendu Chatterjee、Przemyslaw Daca、Jan Kretínsk和Tobias Meggendorfer。 2017.马尔可夫决策过程中长期平均回报的价值迭代。 在CAV中。 201--221. https://doi.org/10.1007/978-3-319-63387-9_10 谷歌学者 Pranav Ashok、Krishnendu Chatterjee、Jan Kretinsky、Maximilian Weininger和Tobias Winkler。 2020年广义可达性随机博弈的近似值。 CoRR abs/1908.05106(2020)。 谷歌学者 克里斯特尔·拜尔(Christel Baier)、马库斯·达姆(Marcus Daum)、克莱门斯·杜斯拉夫(Clemens Dubslaff)、约阿希姆·克莱恩(Joachim Klein)和萨沙·克鲁珀霍尔茨(Sascha Klüppelholz)。 2014.能源公用事业数量。 在NASA正式方法中。 285--299. 谷歌学者 克里斯特尔·拜尔(Christel Baier)、克莱门斯·杜斯拉夫(Clemens Dubslaff)和萨沙·克吕佩尔霍尔茨(Sascha Klüppelholz)。 2014年。权衡分析符合概率模型检查。 在CSL-LICS中。 1:1--1:10. 谷歌学者 克里斯特尔·拜尔、克莱门斯·杜斯拉夫、萨沙·克鲁珀霍尔茨、马库斯·达姆、约阿希姆·克莱因、斯特芬·梅克尔和萨沙·温德利希。 2014.概率模型检查和非标准多目标推理。 在FASE中。 1--16. 谷歌学者 克里斯特尔·拜尔(Christel Baier)和朱斯特·佩特尔·卡托恩(Joost-Pieter Katoen)。 2008.模型检查原则。 谷歌学者 尼古拉斯·巴塞特(Nicolas Basset)、玛尔塔·奎亚特科夫斯卡(Marta Z.Kwiatkowska)、乌夫克·托普库(Ufuk Topcu)和克莱门斯·威尔特切(Clemens Wiltsche)。 2015.具有多个长期目标的随机游戏的策略综合。 在TACAS(计算机科学讲义),第9035卷。 施普林格,256-271。 谷歌学者 尼古拉斯·巴塞特(Nicolas Basset)、玛尔塔·奎亚特科夫斯卡(Marta Z.Kwiatkowska)和克莱门斯·威尔特切(Clemens Wiltsche)。 2018.多目标随机博弈的合成策略综合。 Inf.计算。 261,第(2018)部分,536--587。 谷歌学者 Tomás Brázdil、Václav Brozek、Krishnendu Chatterjee、Vojtech Forejt和Antonín Kucera。 2014.关于马尔可夫决策过程中多重平均回报目标的两种观点。 LMCS 10,1(2014)。 https://doi.org/10.2168/LMCS-10 (1:13)2014 谷歌学者 Tomás Brázdil、Krishnendu Chatterjee、Martin Chmelik、Vojtech Forejt、Jan Kretínský、Marta Z.Kwiatkowska、David Parker和Mateusz Ujma。 2014.使用学习算法验证马尔可夫决策过程。 ATVA(计算机科学讲义),第8837卷。 施普林格,98-114。 谷歌学者 Tomás Brázdil、Krishnendu Chatterjee、Vojtech Forejt和Antonín Kucera。 2013年,马尔可夫决策过程稳定性的交易表现。 在LICS中。 331--340. 谷歌学者 Romain Brenguier和Vojtech Forejt。 2016。多目标随机博弈的可决策性结果。 ATVA(计算机科学讲义),第9938卷。 227--243. 谷歌学者 交叉引用 罗曼·布伦吉尔(Romain Brenguier)和珍妮·弗兰索瓦·拉斯金(Jean-François Raskin)。 2015年,多维平均回报游戏的帕累托曲线。 在CAV(2)(计算机科学讲义),第9207卷。 施普林格,251-267。 谷歌学者 克里希南德·查特吉。 2007.具有多个长期平均目标的马尔可夫决策过程。 FSTTCS(计算机科学讲义),第4855卷。 施普林格,473-484。 谷歌学者 Krishnendu Chatterjee和Laurent Doyen。 2016.具有广义平均回报目标的完美信息随机游戏。 在LICS中。 美国医学会,247--256。 谷歌学者 克里希南德·查特吉和纳塔娜·菲亚尔科夫。 2011年,从平价游戏减少到简单随机游戏。 在甘道夫。 74--86. https://doi.org/10.4204/EPTCS.54.6 谷歌学者 Krishnendu Chatterjee、Vojtech Forejt和Dominik Wojtczak。 2013年,图和MDP中的多目标折扣奖励验证。 在LPAR中。 228--242. 谷歌学者 克里希南德·查特吉(Krishnendu Chatterjee)和托马斯·亨廷格(Thomas A Henzinger)。 2008年。价值迭代。 在25年的模型检查中。 施普林格,107--138。 谷歌学者 Krishnendu Chatterjee、Thomas A.Henzinger、Barbara Jobstmann和Arjun Radhakrishna。 2010年。要点:概率游戏的求解器。 在CAV中。 665年至669年。 https://doi.org/10.1007/978-3642-14295-6_57 谷歌学者 克里希南德·查特吉(Krishnendu Chatterjee)、祖扎娜·克伦斯卡(Zuzana Kretínská)和扬·克伦斯克(Jan Kretánsk)。 2017年,统一马尔可夫决策过程中关于多重平均收益目标的两种观点。 《计算机科学中的逻辑方法》13,2(2017)。 谷歌学者 Taolue Chen、Vojtech Forejt、Marta Z.Kwiatkowska、David Parker和Aistis Simaitis。 2013.PRISM-games:随机多人游戏的模型检查器。 在TACAS(计算机科学讲义),第7795卷。 施普林格,185-191。 谷歌学者 Taolue Chen、Vojtech Forejt、Marta Z.Kwiatkowska、Aistis Simaitis和Clemens Wiltsche。 2013.关于多目标随机游戏。 MFCS(计算机科学讲义),第8087卷。 施普林格,266--277。 谷歌学者 Taolue Chen、Vojtech Forejt、Marta Z.Kwiatkowska、Aistis Simaitis和Clemens Wiltsche。 2013.关于多目标随机游戏。 技术报告。 266至277页。 谷歌学者 Taolue Chen、Marta Z.Kwiatkowska、Aistis Simaitis和Clemens Wiltsche。 2013年,《多目标随机游戏综合:城市自主驾驶应用》。 在QEST中。 322--337. https://doi.org/10.1007/978-3-642-40196-1_28 谷歌学者 Chih-Hong Cheng、Alois Knoll、Michael Luttenberger和Christian Buckl。 2011年,GAVS+:算法游戏解决研究的开放平台。 在ETAPS中。 258--261. https://doi.org/10.1007/978-3-642-19835-9_22 谷歌学者 安妮·康登。 1992.随机博弈的复杂性。 信息与计算96,2(1992),203--224。 谷歌学者 数字图书馆 安妮·康登。 1993年。关于简单随机游戏的算法。 《计算复杂性理论进展》,离散数学和理论计算机科学DIMACS系列第13卷。 美国数学学会,51-73。 谷歌学者 科斯塔斯·库库贝蒂斯和米哈利斯·扬纳卡基斯。 1995.概率验证的复杂性。 J.ACM 42,4(1995年7月),857--907。 谷歌学者 数字图书馆 库沙·埃特萨米(Kousha Etessami)、玛尔塔·奎亚特·科夫斯卡(Marta Z.Kwiatkowska)、莫舍·瓦尔迪(Moshe Y.Vardi)和米哈利斯·扬纳卡基斯(Mihalis Yannakakakis)。 2008。马尔可夫决策过程的多目标模型检查。 计算机科学中的逻辑方法4,4(2008)。 谷歌学者 J.A.Filar、D.Krass和K.W Ross。 1995.限制平均马尔可夫决策过程的百分位性能标准。 《自动控制》,IEEE汇刊,第40期,第1期(1995年1月),第2-10页。 谷歌学者 交叉引用 Vojtech Forejt、Marta Z.Kwiatkowska、Gethin Norman、David Parker和Hongyang Qu.2011年。 概率系统的定量多目标验证。 在TACAS中。 112--127. https://doi.org/10.1007/978-3-642-19835-9_11 谷歌学者 Vojtech Forejt、Marta Z.Kwiatkowska和David Parker。 2012.概率模型检查的帕累托曲线。 ATVA(计算机科学讲义),第7561卷。 施普林格,317-332。 谷歌学者 Christoph Haase、Stefan Kiefer和Markus Lohrey。 2017.使用多维成本计算马尔可夫链中的分位数。 在LICS中。 1--12. 谷歌学者 谢尔盖·哈达德和本杰明·蒙梅格。 2018年,MDP和IMDP的区间迭代算法。 西奥。 计算。 科学。 735 (2018), 111--131. 谷歌学者 交叉引用 A.海彻。 2002.代数拓扑。 剑桥大学出版社。 https://books.google.de/books?id=BjKs86kosqgC 谷歌学者 Edon Kelmendi、Julia Krämer、Jan Kretínsk和Maximilian Weininger。 2018.简单随机游戏的值迭代:停止标准和学习算法。 在CAV中。 https://doi.org/10.1007/978-3-319-96145-3_36 谷歌学者 玛尔塔·奎亚特科夫斯卡、大卫·帕克和克莱门斯·威尔奇。 2016年,PRISM-Games 2.0:随机游戏多目标策略合成工具。 在TACAS(计算机科学讲义),第9636卷。 斯普林格,560-566。 谷歌学者 玛尔塔·奎亚特科夫斯卡、大卫·帕克和克莱门斯·威尔奇。 2018年。PRISM-games:多目标随机多层游戏的验证和策略合成。 STTT 20,2(2018),195-210。 谷歌学者 数字图书馆 Marta Z.Kwiatkowska、Gethin Norman和David Parker。 2011年,PRISM 4.0:概率实时系统验证。 在CAV(计算机科学讲义),第6806卷。 施普林格,585--591。 谷歌学者 H.Brendan Mcmahan、Maxim Likhachev和Geoffrey J.Gordon。 2005.有界实时动态编程:具有单调上界和性能保证的RTDP。 在ICML 05中。 569--576. 谷歌学者 Christos H.Papadimitriou和Mihalis Yannakakis。 2000.关于交易的近似性和Web资源的最佳访问。 在FOCS中。 IEEE计算机学会,86-92。 谷歌学者 马丁·普特曼。 2014.马尔可夫决策过程:离散随机动态规划。 约翰·威利父子公司。 谷歌学者 米凯尔·兰德尔(Mickael Randour)、珍妮·弗兰索瓦·拉斯金(Jean-François Raskin)和奥坎·桑库尔(Ocan Sankur)。 2015。多维马尔可夫决策过程中的百分比查询。 在CAV(1)(计算机科学课堂讲稿),第9206卷。 施普林格,123-139。 谷歌学者 米凯尔·兰德尔(Mickael Randour)、珍妮·弗兰索瓦·拉斯金(Jean-François Raskin)和奥坎·桑库尔(Ocan Sankur)。 2017.多维马尔可夫决策过程中的百分比查询。 系统设计中的形式化方法50,2-3(2017),207-248。 https://doi.org/10.1007/s10703-016-0262-7 谷歌学者 数字图书馆 玛丽亚·斯沃伦诺娃(Maria Svorenová)和玛塔·奎亚特科夫斯卡(Marta Kwiatkowska)。 2016.随机游戏的定量验证和策略合成。 《欧洲期刊控制》30(2016),15-30。 https://doi.org/10.1016/j.ejcon.2016.04.009 谷歌学者 交叉引用 亚伦·维纳(Yaron Velner)。 2015年,稳健的多维Mean-Payoff游戏无法确定。 在FoSSaCS中。 施普林格,312--327。 谷歌学者
索引术语
广义可达性随机对策的近似值