×

递归检查游戏。 (英语) Zbl 1347.91010号

总结:我们考虑一个顺序检查游戏,其中检查员在较长的时间段内使用有限数量的检查来检测检查员的违规行为(非法行为)。与早期模型相比,我们允许对成功违规的检查员给予不同的奖励。举一个可能的例子,最有价值的奖励可能是完成制造核弹所需的一系列核材料盗窃。监督员可以观察监督员,但监督员只能确定是否在他检查的阶段发生违规行为,这将终止游戏;否则游戏将继续。
在合理的报酬假设下,检查员的策略与成功违规的数量无关。这允许应用游戏的递归描述,即使这通常假定每个阶段之后玩家都完全知情。由此得到的博弈均衡收益的三变量递归方程推广了其他几种已知的此类方程,并用二项式系数和显式求解。
我们还将此方法扩展到非零和博弈和“监督员领导”,其中监督员承诺(相同)随机检查时间表,但只要检查仍然存在,监督员就会合法行事(而不是像同时博弈中那样混合)。

MSC公司:

91A05型 2人游戏
91A20型 多阶段重复游戏
91A80型 博弈论的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Avenhaus R,Canty MJ(2005)《为时间而战:一个连续的检查游戏》。欧洲药典。物件。167(2):475-492. 交叉参考·Zbl 1075.90021号
[2] Avenhaus R,Canty MJ(2012)《检查游戏》。Meyers RA编辑。计算复杂性:理论、技术和应用(纽约州施普林格),1605-1618年。交叉参考
[3] Avenhaus R,von Stengel B(1992)非零和Dresher检查游戏。Gritzmann P、Hettich R、Horst R、Sachs E编辑。运筹学’91(德国海德堡Physica-Verlag),第376-379页。
[4] Avenhaus R、Okada A、Zamir S(1991)《信息不完整的检查员领导》。Selten R编辑。博弈均衡模型IV(柏林施普林格),319-361。交叉参考·Zbl 0736.90089号
[5] Avenhaus R、von Stengel B、Zamir S(2002)《检查游戏》。Aumann RJ,Hart S编辑。博弈论手册第3卷(荷兰北部,阿姆斯特丹),1947-1987年。
[6] Baston VJ,Bostock FA(1991)《一个广义的检查游戏》。海军后勤研究。38(2):171-182. 交叉参考·Zbl 0719.90097号
[7] 古诺AA(1838)富豪数学研究所(巴黎哈切特)。[翻译为:财富理论的数学原理研究(麦克米兰,伦敦,1897年)
[8] Delle Fave FM,Jiang AX,Yin Z,Zhang C,Tambe M,Kraus S,Sullivan JP(2014)具有动态执行不确定性的博弈论安全巡逻和真实交通系统的案例研究。J.人工智能研究。50:321-367. ·Zbl 1364.93013号
[9] Deutsch Y、Golany B、Goldberg N、Rothblum UG(2013)《具有本地和全球分配边界的检查游戏》。海军后勤研究。60(2):125-140. 交叉参考
[10] Dresher M(1962年)军备控制协议中的抽样检查问题:博弈分析备忘录RM-2972-ARPA(兰德公司,加利福尼亚州圣莫尼卡)。
[11] Everett H(1957)递归游戏。Dresher M,Tucker AW,Wolfe P,编辑。对游戏理论的贡献III《数学研究年鉴》39(普林斯顿大学出版社,新泽西州普林斯顿),第47-78页。
[12] Feller W(1968)概率论及其应用简介,第一卷,第三版(John Wiley&Sons,纽约)·Zbl 0155.23101号
[13] Ferguson TS,Melolidakis C(1998)关于检查赛。海军后勤研究。45(3):327-334. 交叉参考·Zbl 0941.91013号
[14] Ferguson TS,Melolidakis C(2000)有限资源的游戏。国际。J.博弈论29(2):289-303. 交叉参考·Zbl 1053.91003号
[15] Gale D(1957)有限资源博弈中的信息。Dresher M,Tucker AW,Wolfe P,编辑。对游戏理论的贡献III《数学研究年鉴》39(普林斯顿大学出版社,新泽西州普林斯顿),141-145。
[16] Höpfinger E(1971)一个检验问题的博弈分析未出版手稿,德国卡尔斯鲁厄大学。
[17] Kuhn HW(1953)广泛的游戏和信息问题。Kuhn HW,Tucker AW,编辑。对游戏理论的贡献II《数学研究年鉴》28(普林斯顿大学出版社,新泽西州普林斯顿),193-216。交叉参考
[18] Kuhn HW(1963)递归检查游戏。Anscombe FJ、Davis MD、Kuhn HW、Maschler M、Mills ND编辑。统计方法在军备控制和裁军中的应用根据合同ACDA/ST-3第三部分(Mathematica,新泽西州普林斯顿)向美国军备控制与裁军署提交的最终报告,169-181。
[19] Maschler M(1966)解决检查员非恒定和博弈的价格领先方法。海军后勤研究。夸脱。13(1):11-33. 交叉参考·Zbl 0154.20304号
[20] Osborne MJ,Rubinstein A(1994)博弈论课程(麻省理工学院出版社,马萨诸塞州剑桥)。
[21] Rinderle K(1996)Mehrstufige sequentielle Inspektionsspiele mit statistischen Fehlern erster und zweiter Art(具有第一类和第二类统计误差的多阶段序贯检验游戏)(德国汉堡科瓦奇)。
[22] Sakaguchi M(1977)针对不同值的目标的顺序分配游戏。《运营杂志》。Res.Soc.日本20(3):182-193. ·Zbl 0372.90132号
[23] Sakaguchi M(1994)一个多机会渗透的连续游戏。日本数学39(1):157-166. ·Zbl 0791.60035号
[24] Thomas MU,Nisgav Y(1976)一个具有时间相关回报的渗透游戏。海军后勤部。夸脱。23(2):297-302. 交叉参考·Zbl 0325.90084号
[25] 冯·斯塔克伯格(1934)Marktform und Gleichgewicht公司(柏林施普林格)。[翻译为:市场结构与均衡(施普林格,柏林,2011)。]
[26] von Stengel B(1991)递归检查游戏。德国慕尼黑武装部队大学S-9106技术报告。2016年2月2日访问。http://www.maths.lse.ac.uk/Personal/stengel/TEXTE/rech.pdf。 ·Zbl 1347.91010号
[27] von Stengel B(1996)行为策略的有效计算。游戏经济。行为。14(2):220-246。交叉参考·Zbl 0867.90131号
[28] von Stengel B,Zamir S(2010)凸策略集领导博弈。游戏经济。行为。69(2):446-457. 交叉参考·Zbl 1230.91022号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。