文件Zbl 1467.68161-zbMATH Open

关于量化游戏中的满意度。（英语） Zbl 1467.68161号

Groote，Jan Friso（编辑）等人，《系统构建和分析的工具和算法》。第27届国际会议，TACAS 2021，作为欧洲软件理论和实践联席会议的一部分，ETAPS 2021，卢森堡市，2021年3月27日至4月1日。诉讼程序。第一部分查姆：施普林格。勒克特。注释计算。科学。12651, 20-37 (2021).

概要：规划和反应合成中的几个问题可以归结为两层定量图对策的分析。优化是一种分析形式。我们认为，在许多情况下，用满足问题，其中的目标不是搜索最佳解决方案，而是搜索符合给定阈值界限的解决方案。
本文定义并研究了具有折扣和成本模型的两层图对策的满意问题。我们表明，虽然可以像优化问题一样使用数值方法来解决令人满意的问题，但这种方法并没有比优化带来显著的好处。然而，当折扣因子是整数时，我们提出了另一种满足的方法，它完全基于自动机方法。我们表明，该方法在理论和实证上都具有更高的算法性能，并证明了满足优于优化的更广泛适用性。
关于整个系列，请参见[Zbl 1466.68015号].

MSC公司：

68T20型	人工智能背景下的问题解决（启发式、搜索策略等）
65年第68季度	形式语言和自动机
90立方厘米	涉及图形或网络的编程
91A43型	涉及图形的游戏
91A80型	博弈论的应用

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

参考文献：

[1]	令人满意。https://en.wikipedia.org/wiki/Sattificing。
[2]	GMP。https://gmplib.org/。
[3]	B.Alpern和F.B.Schneider。认识到安全和活力。分布式计算，2（3）：117-1261987·Zbl 0641.68039号
[4]	C.拜尔。概率模型检查。在可靠软件系统工程中，第1-23页。2016
[5]	S.Bansal、S.Chaudhuri和M.Y.Vardi。自动与线性编程的折扣和包含。程序中。2018年国际计算机辅助验证会议（CAV）。
[6]	S.Bansal、S.Chaudhuri和M.Y.Vardi。定量验证中的比较自动机。程序中。2018年软件科学与计算结构基础国际会议（FoSSaCS）·Zbl 1504.68126号
[7]	S.Bansal、S.Chaudhuri和M.Y.Vardi。定量验证中的比较器自动机（完整版）。CoRR，abs/1812.065692018年·Zbl 1504.68126号
[8]	S.Bansal、Y.Li、L.Tabajara和M.Y.Vardi。基于有限水平规范的反应合成混合成分推理。程序中。AAAI，2020年。
[9]	S.Bansal和M.Y.Vardi。安全和协同安全自动比较器，用于折扣和包含。程序中。2019年国际计算机辅助验证会议（CAV）。
[10]	J.Bernet、D.Janin和I.Walukiewicz。许可策略：从平价游戏到安全游戏。RAIRO-理论信息学与应用-信息技术与应用，36（3）：261-2752002·兹比尔1090.91514
[11]	R.Bloem、K.Chatterjee、T.Henzinger和B.Jobstmann。通过量化目标提高合成质量。程序中。第140-156页。施普林格，2009年·Zbl 1242.68151号
[12]	U.Boker和T.A.Henzinger。折扣和自动机的精确和近似确定。LMCS，2014年第10（1）期·Zbl 1325.68126号
[13]	K.Chatterjee、T.A.Henzinger、J.Otop和Y.Velner。定量公平模拟游戏。信息与计算，254:143-1662017·Zbl 1370.68165号
[14]	D.Clark、S.Hunt和P.Malacaria。用简单命令式语言量化信息流的静态分析。《计算机安全杂志》，15（3）：321-3712007。
[15]	T.Colcombet和N.Fijalkow。通用图形和游戏自动机：无限长游戏的新工具。程序中。FSTTCS，第1-26页。斯普林格，2019年·Zbl 1528.91016号
[16]	B.Finkbeiner、C.Hahn和H.Torfah。模型检查定量超属性。程序中。第144-163页。施普林格，2018年·Zbl 1511.68154号
[17]	T.D.Hansen、P.B.Miltersen和U.Zwick。对于具有常数折扣因子的2人回合随机博弈，策略迭代是强多项式。《美国医学会杂志》，2013年第60期·Zbl 1281.91019号
[18]	K.He、M.Lahijanian、L.Kavraki和M.Vardi。资源约束下有限任务的反应合成。智能机器人和系统（IROS），2017 IEEE/RSJ国际会议，第5326-5332页。IEEE，2017年
[19]	O.Kupferman和M.Y.Vardi。安全特性的模型检查。程序中。第172-183页。斯普林格，1999年·Zbl 1046.68597号
[20]	M.Kwiatkowska。定量验证：模型、技术和工具。程序中。欧洲软件工程会议第六次联席会议和ACM SIGSOFT软件工程基础研讨会（ESEC/FSE），第449-458页。ACM出版社，2007年9月。
[21]	M.Kwiatkowska、G.Norman和D.Parker。概率模型检验的进展和挑战。2010年第48届Allerton通信、控制和计算年会（Allerton），1691-1698页。IEEE，2010年。
[22]	M.Lahijanian、S.Almagor、D.Fried、L.Kavraki和M.Vardi。这一次机器人解决了一个成本问题：时间逻辑规划的定量方法，部分令人满意。在AAAI中，第3664-3671页，2015年
[23]	M.L.利特曼。顺序决策算法。罗得岛州普罗维登斯布朗大学，1996年。
[24]	M.Osborne和A.Rubinstein。博弈论课程。麻省理工学院出版社，1994年·Zbl 1194.91003号
[25]	M.Puterman先生。马尔可夫决策过程。运筹学和管理科学手册，2:331-4341990·兹比尔0703.90091
[26]	S.A.Seshia、A.Desai、T.Dreossi、D.J.Fremont、S.Ghosh、E.Kim、S.Shivakumar、M.Vazquez-Chanlatte和X.Yue。深度神经网络的形式规范。程序中。第20-34页。施普林格，2018年·Zbl 1517.68345号
[27]	L.S.沙普利。随机游戏。《美利坚合众国国家科学院院刊》，39（10）：10951953·兹比尔0051.35805
[28]	R.Sutton和A.Barto。强化学习简介，第135卷。麻省理工学院出版社，剑桥，1998年·Zbl 1407.68009号
[29]	L.M.Tabajara和M.Y.Vardi。LTLf合成中的分配技术。在IJCAI中，第5599-5606页。AAAI出版社，2019年。
[30]	W.Thomas，T.Wilke等人，《自动化、逻辑和无限游戏：当前研究指南》，第2500卷。斯普林格科学与商业媒体，2002年·Zbl 1011.00037号
[31]	M.Wen、R.Ehlers和U.Topcu。具有时序逻辑约束的正确综合强化学习。2015年IEEE/RSJ智能机器人和系统国际会议（IROS），第4983-4990页。IEEE，2015年。
[32]	U.Zwick和M.Paterson。图上平均收益博弈的复杂性。理论计算机科学，158（1）：343-3591996·兹伯利0871.68138

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：书本；一：书籍文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

关于量化游戏中的满意度。（英语） Zbl 1467.68161号

MSC公司：

参考文献：

示例

领域

操作员

关于量化游戏中的满意度。 （英语） Zbl 1467.68161号

MSC公司：

参考文献：

关于量化游戏中的满意度。（英语） Zbl 1467.68161号