×

关于量化游戏中的满意度。 (英语) Zbl 1467.68161号

Groote,Jan Friso(编辑)等人,《系统构建和分析的工具和算法》。第27届国际会议,TACAS 2021,作为欧洲软件理论和实践联席会议的一部分,ETAPS 2021,卢森堡市,2021年3月27日至4月1日。诉讼程序。第一部分查姆:施普林格。勒克特。注释计算。科学。12651, 20-37 (2021).
概要:规划和反应合成中的几个问题可以归结为两层定量图对策的分析。优化是一种分析形式。我们认为,在许多情况下,用满足问题,其中的目标不是搜索最佳解决方案,而是搜索符合给定阈值界限的解决方案。
本文定义并研究了具有折扣和成本模型的两层图对策的满意问题。我们表明,虽然可以像优化问题一样使用数值方法来解决令人满意的问题,但这种方法并没有比优化带来显著的好处。然而,当折扣因子是整数时,我们提出了另一种满足的方法,它完全基于自动机方法。我们表明,该方法在理论和实证上都具有更高的算法性能,并证明了满足优于优化的更广泛适用性。
关于整个系列,请参见[Zbl 1466.68015号].

MSC公司:

68T20型 人工智能背景下的问题解决(启发式、搜索策略等)
65年第68季度 形式语言和自动机
90立方厘米 涉及图形或网络的编程
91A43型 涉及图形的游戏
91A80型 博弈论的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 令人满意。https://en.wikipedia.org/wiki/Sattificing。
[2] GMP。https://gmplib.org/。
[3] B.Alpern和F.B.Schneider。认识到安全和活力。分布式计算,2(3):117-1261987·Zbl 0641.68039号
[4] C.拜尔。概率模型检查。在可靠软件系统工程中,第1-23页。2016
[5] S.Bansal、S.Chaudhuri和M.Y.Vardi。自动与线性编程的折扣和包含。程序中。2018年国际计算机辅助验证会议(CAV)。
[6] S.Bansal、S.Chaudhuri和M.Y.Vardi。定量验证中的比较自动机。程序中。2018年软件科学与计算结构基础国际会议(FoSSaCS)·Zbl 1504.68126号
[7] S.Bansal、S.Chaudhuri和M.Y.Vardi。定量验证中的比较器自动机(完整版)。CoRR,abs/1812.065692018年·Zbl 1504.68126号
[8] S.Bansal、Y.Li、L.Tabajara和M.Y.Vardi。基于有限水平规范的反应合成混合成分推理。程序中。AAAI,2020年。
[9] S.Bansal和M.Y.Vardi。安全和协同安全自动比较器,用于折扣和包含。程序中。2019年国际计算机辅助验证会议(CAV)。
[10] J.Bernet、D.Janin和I.Walukiewicz。许可策略:从平价游戏到安全游戏。RAIRO-理论信息学与应用-信息技术与应用,36(3):261-2752002·兹比尔1090.91514
[11] R.Bloem、K.Chatterjee、T.Henzinger和B.Jobstmann。通过量化目标提高合成质量。程序中。第140-156页。施普林格,2009年·Zbl 1242.68151号
[12] U.Boker和T.A.Henzinger。折扣和自动机的精确和近似确定。LMCS,2014年第10(1)期·Zbl 1325.68126号
[13] K.Chatterjee、T.A.Henzinger、J.Otop和Y.Velner。定量公平模拟游戏。信息与计算,254:143-1662017·Zbl 1370.68165号
[14] D.Clark、S.Hunt和P.Malacaria。用简单命令式语言量化信息流的静态分析。《计算机安全杂志》,15(3):321-3712007。
[15] T.Colcombet和N.Fijalkow。通用图形和游戏自动机:无限长游戏的新工具。程序中。FSTTCS,第1-26页。斯普林格,2019年·Zbl 1528.91016号
[16] B.Finkbeiner、C.Hahn和H.Torfah。模型检查定量超属性。程序中。第144-163页。施普林格,2018年·Zbl 1511.68154号
[17] T.D.Hansen、P.B.Miltersen和U.Zwick。对于具有常数折扣因子的2人回合随机博弈,策略迭代是强多项式。《美国医学会杂志》,2013年第60期·Zbl 1281.91019号
[18] K.He、M.Lahijanian、L.Kavraki和M.Vardi。资源约束下有限任务的反应合成。智能机器人和系统(IROS),2017 IEEE/RSJ国际会议,第5326-5332页。IEEE,2017年
[19] O.Kupferman和M.Y.Vardi。安全特性的模型检查。程序中。第172-183页。斯普林格,1999年·Zbl 1046.68597号
[20] M.Kwiatkowska。定量验证:模型、技术和工具。程序中。欧洲软件工程会议第六次联席会议和ACM SIGSOFT软件工程基础研讨会(ESEC/FSE),第449-458页。ACM出版社,2007年9月。
[21] M.Kwiatkowska、G.Norman和D.Parker。概率模型检验的进展和挑战。2010年第48届Allerton通信、控制和计算年会(Allerton),1691-1698页。IEEE,2010年。
[22] M.Lahijanian、S.Almagor、D.Fried、L.Kavraki和M.Vardi。这一次机器人解决了一个成本问题:时间逻辑规划的定量方法,部分令人满意。在AAAI中,第3664-3671页,2015年
[23] M.L.利特曼。顺序决策算法。罗得岛州普罗维登斯布朗大学,1996年。
[24] M.Osborne和A.Rubinstein。博弈论课程。麻省理工学院出版社,1994年·Zbl 1194.91003号
[25] M.Puterman先生。马尔可夫决策过程。运筹学和管理科学手册,2:331-4341990·兹比尔0703.90091
[26] S.A.Seshia、A.Desai、T.Dreossi、D.J.Fremont、S.Ghosh、E.Kim、S.Shivakumar、M.Vazquez-Chanlatte和X.Yue。深度神经网络的形式规范。程序中。第20-34页。施普林格,2018年·Zbl 1517.68345号
[27] L.S.沙普利。随机游戏。《美利坚合众国国家科学院院刊》,39(10):10951953·兹比尔0051.35805
[28] R.Sutton和A.Barto。强化学习简介,第135卷。麻省理工学院出版社,剑桥,1998年·Zbl 1407.68009号
[29] L.M.Tabajara和M.Y.Vardi。LTLf合成中的分配技术。在IJCAI中,第5599-5606页。AAAI出版社,2019年。
[30] W.Thomas,T.Wilke等人,《自动化、逻辑和无限游戏:当前研究指南》,第2500卷。斯普林格科学与商业媒体,2002年·Zbl 1011.00037号
[31] M.Wen、R.Ehlers和U.Topcu。具有时序逻辑约束的正确综合强化学习。2015年IEEE/RSJ智能机器人和系统国际会议(IROS),第4983-4990页。IEEE,2015年。
[32] U.Zwick和M.Paterson。图上平均收益博弈的复杂性。理论计算机科学,158(1):343-3591996·兹伯利0871.68138
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。