×

一类闭环Stackelberg对策的反向归纳算法。 (英语) Zbl 1338.91043号

摘要:提出了一种新的确定性连续策略双层离散时间动态Stackelberg对策,该对策具有固定的有限持续时间和闭环信息结构。所考虑的支付函数可以广泛应用于不同的应用中(主要是在消耗有限资源的冲突中,其中一个参与者(称为领导者)首先是上级权力选择策略,另一个参与者,称为追随者,则在其后选择)。
在凸支付函数和某些参数值的情况下,我们给出了一种新的特殊的后向归纳算法,该算法可以很容易地实现,以找到一个(leader-flower)博弈的均衡(从最后一步到第一步的某种顺序均衡实现,与玩家当前的策略选择有关)。还提供了对唯一性和游戏规则的考虑(即设置游戏参数以实现预定义的平衡)。给出了该博弈的有限版本(具有有限策略集)及其简化和求解方法。通过几个实例说明了结果的综合应用可能性。

MSC公司:

91A65型 分级游戏(包括Stackelberg游戏)
91A05级 2人游戏
91A25型 动态游戏
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] 阿达·J。;库珀,R.W.,《动态经济学:定量方法和应用》(2003),麻省理工学院出版社
[2] 新墨西哥州阿伦达尔。;Sirakaya,S.,用同步并行遗传算法在线计算Stackelberg均衡,经济动力学与控制杂志,27,8,1503-1515(2003)·Zbl 1178.91023号
[3] Amir,R.,Stackelberg vs.Cournot均衡,游戏与经济行为,26,1-21(1999)·Zbl 0915.90041号
[4] 巴沙尔,T。;Olsder,G.J.,《动态非合作博弈论》(1995),学术出版社:纽约学术出版社·兹比尔0828.90142
[5] 巴沙尔,T。;Selbuz,H.,闭环Stackelberg策略及其在多级系统最优控制中的应用,IEEE自动控制汇刊,24166-179(1979)·兹比尔0405.49020
[6] Benchekroun,H。;Withagen,C.,《关于不可再生资源卡特尔边缘博弈中的价格接受行为》,《博弈与经济行为》,76,355-374(2012)·Zbl 1260.91104号
[7] Bertsekas,D.P.,《动态规划和最优控制》(2007),雅典娜科学出版社
[11] 卡迪纳尔,J。;Demaine,E.D。;菲奥里尼,S。;Joret,G。;Langerman,S。;Newman,I.,《Stackelberg最小生成树游戏》,《算法》,59,2,129-144(2011)·Zbl 1207.90091号
[12] Chen,C.I。;Cruz,J.B.,带偏差信息模式的两人游戏的Stackelberg解,IEEE自动控制交易,17,6,791-798(1972)·Zbl 0262.90095号
[13] 科尔曼,A.M。;Stirk,J.A.,《混合动机游戏中的Stackelberg推理:实验研究》,《经济心理学杂志》,第19期,第279-293页(1998年)
[14] Dastidar,K.G.,《同质产品市场中的Stackelberg游戏》,《欧洲经济评论》,48,549-562(2004)
[15] Dempe,S。;Franke,S.,乐观线性Stackelberg问题的求解算法,计算机与运筹学,41,277-281(2014)·Zbl 1348.91081号
[16] 杜,G。;焦荣杰。;Chen,M.,通过Stackelberg游戏联合优化产品系列配置和缩放设计,《欧洲运筹学杂志》,232,2,330-341(2014)·Zbl 1305.90221号
[17] Farkas,I。;J.Buzás。;洛杉矶体育馆。;卡尔马尔,I。;卡博迪,E。;Nagy,L.,游泳池和幼儿园使用的组合式太阳能热水系统,(Frankovic/,B.,《能源与环境》,第一卷(2000年),克罗地亚太阳能协会:克罗地亚太阳能协会,克罗地亚Opatija),81-88
[18] Freiling,G。;Jank,G。;Abou-Kandil,H.,开环Nash和Stackelberg博弈中的离散时间Riccati方程,欧洲控制杂志,5,1,56-66(1999)·Zbl 1093.91505号
[19] Freiling,G。;Jank,G。;Lee,S.R.,线性二次微分对策中开环Stackelberg平衡的存在性和唯一性,最优化理论与应用杂志,110,3515-544(2001)·Zbl 0989.49027号
[20] 霍夫曼,M。;Rota-Graziosi,G.,《寻租和冲突模型中的内生时间选择》,《游戏与经济行为》,第75期,第168-184页(2012年)·兹比尔1279.91046
[21] 哈克,S。;缪勒,W。;Norman,H.T.,Stackelberg击败古诺:论实验市场中的共谋与效率,《经济杂志》,111,474,749-765(2001)
[22] Jungers,M。;Trélat,埃及。;Abou-Kandil,H.,《闭环信息结构的Min-max和Min-Min Stackelberg策略》,《动力与控制系统杂志》,17,3,387-425(2011)·Zbl 1228.91019号
[23] Kicsiny,R。;Farkas,I.,《太阳能加热系统的改进差动控制》,太阳能,86,3489-3498(2012)
[26] Korzhyk,D。;尹,Z。;Kiekintveld,C。;科尼策,V。;Tambe,M.,《安全游戏中的Stackelberg vs.Nash:互换性、等价性和唯一性的扩展研究》,《人工智能研究杂志》,41,297-327(2011)·Zbl 1219.91032号
[27] 库恩,H.W。;塔克,A.,《对博弈论的贡献》,第二卷(1953年),普林斯顿大学出版社·Zbl 1341.91006号
[28] 卢,P.B。;Chang,S。;Chang,T.,多阶段Stackelberg博弈的解和性质,Automatica,20,2,251-256(1984)·Zbl 0529.90105号
[29] Madani,K.,《博弈论与水资源》,《水文学杂志》,381225-238(2010)
[30] 马丁·埃尔兰,G。;Taboubi,S。;Zaccour,G.,货架空间分配的时间一致性开环Stackelberg均衡,Automatica,41971-982(2005)·Zbl 1117.91013号
[31] Molnár,S。;Szidarovszky,F.,博弈论:多目标优化、冲突解决、差分对策(2011),计算机图书:布达佩斯计算机图书,(匈牙利语)
[33] Nie,P.,《开环完全信息下的动态Stackelberg博弈》,《富兰克林研究所杂志》,34277-748(2005)·Zbl 1178.91025号
[34] 聂,P。;Chen,L。;Fukushima,M.,离散时间动态反馈Stackelberg对策的动态规划方法,独立和依赖追随者,欧洲运筹学杂志,169,1,310-328(2006)·Zbl 1101.91013号
[35] 帕尔达洛斯,P.M。;Siskos,Y。;Zopounidis,C.,《多标准分析进展》(1995),施普林格出版社·Zbl 0847.00021号
[37] 罗曼诺,R。;Yildirim,H.,《论古诺-纳什和斯塔克伯格均衡的内生性:积累的博弈》,《经济理论杂志》,120,1,73-107(2005)·Zbl 1122.91012号
[38] Rosen,J.B.,凹人博弈平衡点的存在性和唯一性,计量经济学,33,3,520-534(1965)·Zbl 0142.17603号
[39] Roughgarden,T.,Stackelberg调度策略,SIAM计算杂志,33,2,332-350(2004)·Zbl 1080.90046号
[40] Sadigh,A.N。;哈希米,S。;Hamzeh,A.,《Stackelberg游戏的垃圾邮件检测》,《高级计算:国际期刊》,2011年第2期,第32-40页
[41] 夏尔马,Y。;Williamson,D.P.,《网络路由游戏中的Stackelberg阈值或利他主义的价值》,《游戏与经济行为》,67,174-190(2009)·Zbl 1168.91332号
[44] Szidarovszky,F。;Molnár,S。;Okuguchi,K.,An(n)-person Stackelberg leader-leader model,《应用数学与计算》,46,3,221-232(1991)·Zbl 0751.90113号
[45] Teraoka,Y。;Osumi,S。;Hohjo,H.,《一些Stackelberg类型的定位游戏》,计算机和数学应用,461147-1154(2003)·Zbl 1100.91501号
[47] von Stackelberg,H.,《市场结构与均衡》(2011),Springer,(Urch,L.,Hill,R.,&Bazin,D.译)·Zbl 1296.91004号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。