Multi-Objective Model Checking of Markov Decision Processes

Kousha Etessami; Marta Kwiatkowska; Moshe Y. Vardi; Mihalis Yannakakis

doi:10.2168/LMCS-4(4:8)2008

库沙·埃特萨米（Kousha Etessami）；Marta Kwiatkowska；Moshe Y.Vardi；米哈利斯·扬纳卡基斯-马尔可夫决策过程的多目标模型检验

lmcs:990个-计算机科学中的逻辑方法，2008年11月12日，第4卷第4期-https://doi.org/10.2168/LMCS-4(4:8)2008

马尔可夫决策过程的多目标模型检验第条

作者：Kousha Etessami；Marta Kwiatkowska；Moshe Y.Vardi；米哈利斯·扬纳卡基斯

我们研究并提供了多目标模型检查的有效算法马尔可夫决策过程（MDP）问题。给定MDP、M和给定多个线性时间（\omega-常规或LTL）属性\varphi\_i，以及概率r\_i\epsilon[0,1]，i=1，。。。，k、我们问是否存在控制器的策略\sigma，对于所有i由\sigma控制的M的轨迹满足\varphi\_i至少是r_i提供一个算法来决定是否存在这样的策略，以及如果这样就产生了它，它在MDP大小的时间多项式中运行。这样的一种策略可能需要同时使用随机化和记忆。我们还考虑更一般的多目标\omega常规查询，我们用一个应用程序进行激励，以保证组合推理概率系统。请注意，可以在不同属性之间进行权衡：满足具有高概率的属性\varphi\_1可能需要满足\varphi \_2概率很低。将其视为多目标优化问题，我们需要有关“权衡曲线”或帕累托曲线的信息，以便最大化不同性质的概率。我们证明了一个人可以计算关于中一组ω-正则属性的近似Pareto曲线MDP大小的时间多项式。我们的定量上限使用LP方法。我们还研究定性多目标模型检查问题，我们表明可以对这些问题进行分析通过纯粹的图表理论方法，即使策略可能仍然需要随机化和记忆。

https://doi.org/10.2168/LMCS-4(4:8)2008

资料来源：arXiv.org:0810.5728

卷：第4卷第4期

发布日期：2008年11月12日

进口日期：2007年10月4日

关键词：计算机科学-计算机科学中的逻辑，计算机科学-计算复杂性，计算机科学–计算机科学和博弈论，G.3，F.2，F.3.1，F.4.1

许可证：arXiv.org-非排他性分发许可

基金：

来源：OpenAIRE Graph

设计验证的自动机理论方法; 资助单位：国家科学基金；代码：0311326
发展线性时间模型检测技术; 资助单位：国家科学基金；代码：9988322
游戏、固定点和近似研究; 资助单位：国家科学基金；代码：0728736
MRI：收购CITI Terascale集群（CTC）; 资助单位：国家科学基金；代码：0216467

文后参考文献

65引用本文的文件

阿尔瓦罗·贝拉斯克斯；伊斯梅尔·阿尔库里;K.Subramani公司;彼得·沃伊切乔夫斯基（Piotr Wojciechowski）;乔治·阿蒂亚，2023，基于稳态分布的最优确定性控制器综合，自动推理杂志, 67, 1,2017年10月10日至10月17日至2022年9月9日.

克里希南德·查特吉;Joost-Pieter Katoen公司;斯蒂芬妮·莫尔;马克西米利安·魏宁格;托比亚斯·温克勒2023年，具有词典目标的随机游戏，系统设计中的形式化方法,2007年10月10日/10703-023-00411-4, https://doi.org/10.1007/s10703-023-00411-4.

玛尔塔·奎亚特科夫斯卡;格钦·诺曼;大卫·帕克，2022，概率模型检查和自治，伯明翰大学研究门户网站第5、1页，第385-410页，10.1146/年度控制-042820-010947, http://pure-oai.bham.ac.uk/ws/files/154661620/arcras_pmc.pdf.

李美伦;安德烈亚·图里尼;恩斯特·莫里茨·哈恩;知坤社;张丽君，2022，马尔可夫决策过程的概率偏好规划问题，数据归档和网络服务（DANS）第48、5页，第1545-1559页，10.1109/tes.2020.3024215, https://research.utwente.nl/en/publications/1a010458-545a-4222-a167-4e3890839e03.

李兆凯;战友马;夏丽;高英南，2022，FKS上多属性目标可达性问题到多目标集可达性问题的转换方法，对称第14、11页，第2278页，10.3390/sym14112278, https://doi.org/10.3390/sym14112278.

卡洛斯·巴德;阿恩·哈特曼斯;迈克拉·克劳克;简·K·埃因斯克;大卫·帕克;等。,数据归档和网络服务（DANS），《关于定量验证的正确性、准确性和性能》，第216-241页，2021，10.1007/978-3-030-83723-5_15, https://research.utente.nl/en/publications/d3fad36-4fa4-4ae6-805a-9e47dc80ef0c研究.

L.Mandow先生;J.L.佩雷斯-德拉克鲁斯;N.波扎斯，2021，有限精度的多目标动态规划，全局优化杂志第82、3页，第595-614页，10.1007/s10898-021-01096-x号, https://doi.org/10.1007/s10898-021-01096-x网址.

穆拉特·库布特佩（Murat Cubuktepe）；徐哲（Zhe Xu）;Ufuk Topcu公司，2021，具有图形时序逻辑规范的多代理系统的分布式策略合成，IEEE网络系统控制事务第8、4页，第1799-1810页，10.1109/tcns.2021.3084553, https://doi.org/10.1109/tcns.2021.3084553.

蒂姆·夸特曼;Joost-Pieter Katoen公司,计算机科学课堂讲稿《长期平均和总回报的多目标优化》，第230-249页，2021年，10.1007/978-3-030-72016-2_13, https://doi.org/10.1007/978-3-030-72016-2_13.

托比亚斯·温克勒;马克西米利安·魏宁格，2021，多目标错位随机博弈，arXiv（康奈尔大学），346，第83-100页，10.4204/eptcs.346.6.

阿恩·哈特曼斯;塞巴斯蒂安·荣格斯;Joost-Pieter Katoen公司;蒂姆·夸特曼2020年，MDP中的多成本有界权衡分析，自动推理杂志第64、7页，第1483-1522页，2007年10月10日/10817-020-09574-9, https://doi.org/10.1007/s10817-020-09574-9.

Carina Pilch；阿诺德·哈特曼斯;安妮·雷姆克,第23届混合系统国际会议论文集：计算与控制，具有随机触发的混合Petri网的经典和非预测模型检查，2020，悉尼-新南威尔士州-澳大利亚，10.1145/3365365.3382198.

池敏玉;穆罕默德·塔拉&#039；T型;李祥申;凯腾峰，2020，混合动力小蜂窝网络传输策略优化的多目标模型检查，IEEE接入第8页，第71339-71352页，10.1109/访问.2020.2987012, https://doi.org/10.109/access.2020.2987012.

道格拉斯·弗雷泽；鲁本·贾昆塔；鲁斯·霍夫曼；默里爱尔兰；爱丽丝·米勒；等。2020年，自治系统控制器综合的协作模型，计算的形式方面第32、2-3页，第157-186页，2007年10月10日/00165-020-00508-1, https://doi.org/10.1007/s00165-020-00508-1.

弗洛伦特·德尔格兰奇；Joost-Pieter Katoen公司;蒂姆·夸特曼;米凯尔·兰德尔,计算机科学课堂讲稿《多目标MDP中的简单策略》，第346-364页，2020年，10.1007/978-3-030-45190-5_19, https://doi.org/10.1007/978-3-030-45190-5_19.

库沙·埃特萨米（Kousha Etessami）；伊曼纽尔·马丁诺夫,爱丁堡研究探索者（爱丁堡大学）《有序分支MDP的定性多目标可达性》，第67-82页，2020年，10.1007/978-3-030-61739-4_5, http://hdl.handle.net/20.500.11820/f99eaaaa-fb1c-46f5-9565-744fb45c9761.

克里希南德·查特吉;Joost-Pieter Katoen公司;马克西米利安·韦宁格;托比亚斯·温克勒,计算机科学课堂讲稿，《具有词典可达性安全目标的随机博弈》，第398-420页，2020，10.1007/978-3-030-53291-8_21, https://doi.org/10.1007/978-3-030-53291-8-21.

利奥诺·温特勒;拉尔夫·威默;尼尔斯·詹森;伯恩德·贝克尔,arXiv（康奈尔大学）《加强POMDP的决定性政策》，第115-132页，2020年，10.1007/978-3-030-55754-6_7, http://arxiv.org/abs/2007.08351.

普拉纳夫·阿肖克；克里希南德·查特吉;简·K·埃因斯克;马克西米利安·魏宁格;托比亚斯·温克勒,arXiv（康奈尔大学）《广义可达性随机博弈的近似值》，2020年，德国萨尔布吕肯，10.1145/3373718.3394761, https://arxiv.org/abs/1908.05106.

杨柳;芮莉（Rui Li），2020，《通过假设保证推理检查概率自动机的组合随机模型》，国际网络与分布式计算杂志第8、2页，第94页，10.2991/ijndc.k.190918.001, https://doi.org/10.2991/ijndc.k.190918.001.

克里斯特尔·拜尔;霍尔格·赫尔曼斯;Joost-Pieter Katoen公司,计算机科学课堂讲稿《MDP模型检查的10000个方面》，第420-451页，2019年，10.1007/978-3-319-91908-9_21, https://doi.org/10.1007/978-3-319-91908-9_21.

恩斯特·莫里茨·哈恩;阿恩·哈特曼斯;克里斯蒂安·亨塞尔；迈克拉·克劳克;约阿希姆·克莱因（Joachim Klein）；等。,计算机科学课堂讲稿《2019年定量形式模型分析工具的比较》，第69-92页，2019年，10.1007/978-3-030-17502-3_5, https://doi.org/10.1007/978-3-030-17502-3_5.

格哈德·费特维斯;梅克·多尔平豪斯;杰罗尼莫·卡斯特里隆;阿卡什·库马尔;克里斯特尔·拜尔;等。2019年，《面向高度自适应节能计算的架构和先进电子途径》，库科萨（萨克森州和德累斯顿大学图书馆），107，1，第204-231页，10.1109/jproc.2018年2874895, https://tud.qucosa.de/id/qucosa%3A82183.

劳伦特·多恩;蒂埃里·马萨特;马赫萨·希尔穆罕默德，2019，同步马尔可夫决策过程的复杂性，计算机与系统科学杂志，100，第96-129页，2016年10月10日/j.jcss.2018.09.004, https://doi.org/10.1016/j.jcss.2018.09.004.

穆罕默德·塔拉&#039；t吨;李洪深;Chih-Min Yu先生;凯腾峰,2019 IEEE第89届车辆技术会议（VTC2019-Spring），2019年，马来西亚吉隆坡，《实现小蜂窝网络绿色能源利用最大化的最佳传输政策》，10.1109/vtcs弹簧2019.8746328.

阿恩·哈特曼斯;塞巴斯蒂安·荣格斯;Joost-Pieter Katoen公司;蒂姆·夸特曼,计算机科学课堂讲稿《MDP中的多成本有界可达性》，第320-339页，2018年，10.1007/978-3-319-89963-3_19, https://doi.org/10.1007/978-3-319-89963-3_19.

克里斯特尔·拜尔;克莱门斯·杜斯拉夫2018年，在成本效用约束下从验证到合成，SIGLOG新闻，5，4，第26-46页，10.1145/3292048.3292052, https://doi.org/10.1145/3292048.3292052.

克里斯特尔·贝尔;卢卡·德·阿尔法罗;Vojtěch外汇；玛尔塔·奎亚特科夫斯卡,在线电子图书《模型检验概率系统》，第963-999页，2018年，10.1007/978-3-319-10575-8_28.

简·K·埃因斯克;托比亚斯·梅根多夫,arXiv（康奈尔大学），马尔可夫决策过程中可达性和平均收益的条件价值风险，2018年，英国牛津大学，10.1145/3209108.3209176, https://arxiv.org/abs/1805.02946.

杰罗尼莫·卡斯特里隆;Jochen Frohlich公司;安德烈·戈恩斯;塞巴斯蒂安·哈斯；德克·哈比奇;等。2018年，《异构系统的硬件/软件堆栈》，多尺度计算系统上的IEEE事务第4、3页，第243-259页，10.1109/tmscs.2017.2771750.

拉坦·拉尔（Ratan Lal）；帕维思拉·普拉巴卡,2018年第56届Allerton通信、控制和计算年会（Allerton），概率混合系统可达性分析的层次抽象，2018年，伊利诺伊州蒙蒂塞洛，美国，10.1109/allerton.2018.8635976.

罗德里克·布隆;克里希南德·查特吉;芭芭拉·朱布斯曼,在线电子图书《图形游戏与反应合成》，第921-962页，2018年，10.1007/978-3-319-10575-8_27.

克里斯特尔·拜尔;克莱门斯·杜斯拉夫;L'ubošKorenčiak；安东宁·库切拉;VojtěchŘehák,arXiv（康奈尔大学）《最优弹性控制策略综合》，第417-434页，2017年，10.1007/978-3-319-68167-2_27, https://arxiv.org/abs/1707.03223.

马可·波扎诺;哈罗德·布鲁因杰斯；亚历山德罗·西马蒂;Joost-Pieter Katoen；托马斯·诺尔;等。,在线电子图书《航空航天系统的形式方法》，第133-159页，2017年，10.1007/978-981-10-4436-6_6.

米凯尔·兰德尔；Jean-François Raskin女士;奥坎·桑库尔，2017，多维马尔可夫决策过程中的百分位查询，arXiv（康奈尔大学）第50,2-3页，第207-248页，2007年10月10日/10703-016-0262-7.

托马斯·布拉兹迪尔;克里希南德·查特吉;Vojtěch外汇；安东·库奇时代，2017，马尔可夫决策过程稳定性的交易绩效，计算机与系统科学杂志，84，第144-170页，2016年10月10日/j.jcss.2016.09.009, https://doi.org/10.1016/j.jcss.2016.09.009.

亚米利特·塞拉诺·勒雷纳;苏国鑫;大卫·S·罗森布鲁姆,2017年第十一届软件工程基础联席会议记录，扰动MDP的概率模型检查与云计算应用，2017年，德国帕德博恩，10.1145/3106237.3106301.

查普曼和霍尔/CRC电子书，参考文献，第247-271页，2016年，10.1201/b20053-23.

Joost-Pieter Katoen公司,第31届ACM/IEEE计算机科学逻辑年会论文集，概率模型检查景观，2016，美国纽约，10.1145/2933575.2934574.

克里希南德·查特吉;劳伦特·多恩,arXiv（康奈尔大学），《具有广义平均回报目标的完美信息随机博弈》，2016年，美国纽约州纽约市，10.1145/2933575.2934513, https://arxiv.org/abs/1604.06376.

拉希贾尼安（M.Lahijanian）;M.Kwiatkowska先生,牛津大学研究档案馆（ORA）（牛津大学），《具有最优权衡的马尔可夫决策过程规范修订》，2016年，美国内华达州拉斯维加斯，10.1109/cdc.2016.7799414, https://ora.ox.ac.uk/objects/uuid:863e4a92-6a07-40bc-a7d8-dc3331718bf3.

玛尔塔·奎亚特科夫斯卡,牛津大学研究档案馆（ORA）（牛津大学）《网络物理系统定量验证和合成的进展与挑战》，2016年，奥地利维也纳，10.1109/样本.2016.7579999, https://ora.ox.ac.uk/objects/uuid:c3fe9b69-b5a3-4071-9594-a43b48e25a27.

克里斯特尔·拜尔,计算机科学课堂讲稿《关于概率模型中成本-效用约束的推理》，第1-6页，2015年，10.1007/978-3-319-24537-9_1.

克里希南德·查特吉;Zuzana Komarkova；简·克雷汀斯基,arXiv（康奈尔大学）《统一马尔可夫决策过程中对多重平均收益目标的两种观点》，2015年，日本京都，10.1109/lics.2015.32, https://arxiv.org/abs/1502.00611.

米凯尔·兰德尔；Jean-François Raskin女士;奥坎·桑库尔,CiteSeer X（宾夕法尼亚州立大学）《随机最短路径问题的变化》，第1-18页，2015年，10.1007/978-3-662-46081-8_1, http://citeseerx.ist.psu.edu/viewdoc/summary？doi=10.1.1.680.3434.

安德烈亚·图里尼;霍尔格·赫尔曼斯，2014，概率自动机的保成本双模拟，计算机科学中的逻辑方法，第10卷，第4期，2014年10月16日/lmcs-10（4:11）, https://doi.org/10.2168/lmcs-10(4:11)2014.

克里斯特尔·拜尔;克莱门斯·杜斯拉夫;约阿希姆·克莱因（Joachim Klein）；萨沙·克吕佩尔霍尔茨;萨沙·温德利希,计算机科学课堂讲稿《能源效用分析的概率模型检验》，第96-123页，2014年，10.1007/978-3-319-06880-0_5.

克里斯特尔·拜尔;克莱门斯·杜斯拉夫;萨沙·克吕佩尔霍尔茨,第二十届EACSL计算机科学逻辑年会（CSL）和第二十届ACM/IEEE计算机科学逻辑研讨会（LICS）联席会议记录，权衡分析符合概率模型检查，2014年，奥地利维也纳，10.1145/2603088.2603089.

克里斯特尔·拜尔;克莱门斯·杜斯拉夫;萨沙·克吕佩尔霍尔茨;马库斯·达姆;约阿希姆·克莱因（Joachim Klein）；等。,计算机科学课堂讲稿《概率模型检验与非标准多目标推理》，第1-16页，2014年，10.1007/978-3-642-54804-8_1, https://doi.org/10.1007/978-3-642-54804-8_1.

克里斯特尔·拜尔;约阿希姆·克莱因（Joachim Klein）；萨沙·克吕佩尔霍尔茨;萨沙·温德利希,第二十届EACSL计算机科学逻辑年会（CSL）和第二十届ACM/IEEE计算机科学逻辑研讨会（LICS）联席会议记录，《线性时序逻辑重量监测》，2014年，奥地利维也纳，10.1145/2603088.2603162.

克里斯特尔·拜尔;马库斯·达姆;克莱门斯·杜布拉夫;约阿希姆·克莱因；萨沙·克吕佩尔霍尔茨,计算机科学讲义《能源-公用事业分位数》，第285-299页，2014年，10.1007/978-3-319-06200-6_24.

克里希南德·查特吉;莫妮卡·亨津格，2014，《交替Büchi博弈和最大端元分解的高效动态算法》，计算机协会杂志第61、3页，第1-40页，10.1145/2597631.

亚米利特·塞拉诺·勒雷纳,第22届ACM SIGSOFT国际软件工程基础研讨会论文集，《处理非确定性系统验证中的不确定性》，2014年，中国香港，10.1145/2635868.2666598.

玛尔塔·奎亚特科夫斯卡;格钦·诺曼;大卫·帕克;红阳区，2013，通过多目标模型检查进行组合概率验证，信息和计算第232页，第38-65页，10.1016/j.ic.2013.10.001, https://doi.org/10.1016/j.ic.2013.10.001.

陈陶璐;玛尔塔·奎亚特科夫斯卡;Aistis Simaitis；克莱门斯·威尔奇,CiteSeer X（宾夕法尼亚州立大学）《多目标随机博弈综合：城市自主驾驶的应用》，第322-337页，2013年，10.1007/978-3-642-40196-1_28, http://citeseerx.ist.psu.edu/viewdoc/summary？doi=10.1.1.433.2295.

托马·布拉迪尔；克里希南德·查特吉;Vojtech Forejt；安东宁·库塞拉,牛津大学研究档案馆（ORA）（牛津大学）《马尔可夫决策过程稳定性的交易绩效》，2013年，美国洛杉矶州新奥尔良，10.1109/lics.2013.39, https://ora.ox.ac.uk/objects/uuid:98165cbf网址-b07b-4de3-977c-46b3131b216b.

陈陶璐;VojtŞch前景；玛尔塔·奎亚特科夫斯卡;Aistis Simaitis；阿什图什·特里维迪;等。,牛津大学研究档案馆（ORA）（牛津大学）《精确地玩随机游戏》，第348-363页，2012年，10.1007/978-3-642-32940-1_25, https://ora.ox.ac.uk/objects/uuid:0a3de45f-0242-42ac-9a6d-55fb4c3368d0.

拉希贾尼安（M.Lahijanian）;S.B.安德森;C.贝尔塔,2011年美国控制会议记录，根据PCTL规范控制马尔可夫决策过程，2011年，加利福尼亚州旧金山，10.1109/根据2011.5990952.

托马斯·布鲁兹迪尔；V´clav Brozek；克里希南德·查特吉;Vojtech Forejt；安东宁·库塞拉,CiteSeer X（宾夕法尼亚州立大学），《关于马尔可夫决策过程中多重平均收益目标的两种观点》，2011年，加拿大安大略省多伦多，10.1109/lics.2011.10, http://citeseerx.ist.psu.edu/viewdoc/summary？doi=10.1.1.224.9418.

克里斯特尔·拜尔;露西亚布；Boudewijn R.Haverkort；霍尔格·赫尔曼斯;Joost-Pieter Katoen公司，2010，通过马尔可夫奖励模型的模型检查进行绩效评估，系统设计中的形式化方法第36页，第1页，第1-36页，2007年10月10日/10703-009-0088-7.

陆锋;玛尔塔·奎亚特科夫斯卡;大卫·帕克,CiteSeer X（宾夕法尼亚州立大学）《使用学习对概率系统进行组合验证》，2010年，弗吉尼亚州威廉斯堡，美国，109年10月10日/2014年10月20日, http://citeseerx.ist.psu.edu/viewdoc/summary？doi=10.1.1.639.1913.

玛尔塔·奎亚特科夫斯卡;格廷·诺曼;大卫·帕克《概率模型检验的进展和挑战》，2010年，伊利诺伊州蒙蒂塞洛，美国，10.1109/allerton.2010.5707120, https://inria.hal.science/hal-00767474.

迈克尔·乌默尔斯（Michael Ummels）；多米尼克·沃伊特扎克,arXiv（康奈尔大学）《随机博弈中纳什均衡的决策问题》，第515-529页，2009年，10.1007/978-3-642-04027-6_37, https://arxiv.org/abs/0904.3325.

迈克尔·乌默尔斯（Michael Ummels）；多米尼克·沃伊特扎克,arXiv（康奈尔大学）《简单随机多人游戏中纳什均衡的复杂性》，第297-308页，2009年，10.1007/978-3-642-02930-1_25, https://arxiv.org/abs/0902.0101.

杨扬;马克·盖伦;特万·巴斯滕;桑德·斯图伊克;Henk下士,2009 IEEE/ACM/IFIP第七届实时多媒体嵌入式系统研讨会，《探索同步数据流图的性能和资源需求之间的权衡》，2009年，法国格勒诺布尔，10.1109/estmed.2009.5336821.

来源：OpenCitations、OpenAlex和Crossref

共享和导出

咨询统计

这个页面已经被浏览了1580次。

本文的PDF已下载576次。