×

在不同形式的不确定性下,确定正常形式游戏的行为稳健策略。 (英语) Zbl 1487.91005号

概述:行为博弈论的最新进展解决了对依赖完美理性的传统解决方案概念的持续批评:均衡结果往往与经验证据不一致。对于正常形式的游戏,认知层次模型是一个基于顺序推理过程的解决方案概念,能够准确描述实验性人类游戏。这些特征是通过一个统计估计参数来实现的,该参数描述了玩家使用的推理步骤的平均数量。如果任意玩家都知道这个参数事前,他们可以相应地最大化预期回报。然而,考虑到统计估计的性质,这种参数点估计在实验之前是未知的,并且在实验之后容易出错。因此,我们从一个对对手的推理能力不确定的任意玩家的角度出发,将范式博弈视为一个决策问题。假设这样一个玩家正在面对一组有界理性的对手,他们的游戏以认知层次模型为特征,我们开发了一套六个数学规划公式,以最大化玩家的最小回报,我们确定了关于对手群体推理能力的信息水平的适当公式。通过利用稳健优化、随机规划和分布稳健优化技术,我们的模型集在不完全了解对手理性的正规形式博弈中产生了规定的游戏策略。开发了一个实现这些结构的软件包,并将其应用于示例,演示了行为稳健策略如何根据潜在的不确定性而变化。

MSC公司:

91A10号 非合作游戏
91A90型 实验研究
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aghassi,M。;Bertsimas,D.,稳健博弈论,数学规划,107,231-273(2006)·Zbl 1134.91309号
[2] Arifovic,J。;Ledyard,J.,机制设计的行为模型:个体进化学习,《经济行为与组织杂志》,78,374-395(2011)
[3] Bertsimas博士。;B、 出生日期。;Caramanis,C.,稳健优化理论与应用,SIAM Review,53,3,464-501(2011)·兹比尔1233.90259
[4] 巴特,医学硕士。;卡梅勒,C.F.,《作为游戏心理状态的自我参照思维和平衡:功能磁共振成像证据,游戏和经济行为》,52,2,424-459(2005)·Zbl 1117.91302号
[5] 巴特,医学硕士。;Lohrens,T。;卡梅勒,C.F。;Montague,P.R.,《两人谈判博弈中战略类型的神经特征》,《国家科学院学报》,107,46,1-6(2010)
[6] 布朗,M。;Haskell,W.B。;Tambe,M.,《利用多个有界理性对手解决安全游戏中的可扩展性和健壮性问题》,《游戏安全学报》2014年第23-42期(2014年)·Zbl 1453.91007号
[7] Burke,J.V.、Curtis,F.E.、Lewis,A.S.、Overton,M.L.和Simóes,L.E.(2018年)。非光滑优化的梯度采样方法。arXiv:1804.11003,。
[8] 蔡,Y。;坎多根,O。;Daskalakis,C。;Papadimitriou,C.,《零和多元矩阵游戏:Minmax的推广》,运筹学数学,41,2648-655(2016)·Zbl 1336.91009号
[9] 卡梅勒,C。;Loewenstein,G。;Prelec,D.,《神经经济学:神经科学如何为经济学提供信息》,《经济学文献杂志》,第43、1、9-64页(2005年)
[10] 卡梅勒,C.F.,《行为博弈论:战略互动实验》(2011),普林斯顿大学出版社,新泽西州普林斯顿·Zbl 1019.91001号
[11] 卡梅勒,C.F。;Ho,T.-H。;Chong,J.-K.,游戏的认知层次模型,《经济学季刊》,119,3861-898(2004)·Zbl 1074.91503号
[12] Chong,J.-K。;Ho,T.-H。;Camerer,C.,游戏的广义认知层次模型,游戏与经济行为,99,257-274(2016)·Zbl 1394.91009号
[13] 科里切利,G。;Nagel,R.,内侧前额皮质战略推理深度的神经相关性,《美国国家科学院院刊》,23(2009)
[14] Costa-Gomes,M。;克劳福德,V.P。;Broseta,B.,《正常形态游戏中的认知和行为:一项实验研究》,《计量经济学》,69,5,1193-1235(2001)
[15] 克劳福德,V.P。;库格勒,T。;内曼,Z。;Pauzner,A.,《行为优化拍卖设计:实例与观察》,《欧洲经济协会杂志》,第7期,第2-3期,第377-387页(2009年)
[16] De Clippel,G。;Saran,R。;Serrano,R.,Level-k机制设计,《经济研究评论》,86,3,1207-1227(2019)·Zbl 1479.91068号
[17] 加布里埃尔,V。;穆拉特,C。;Theile,A.,《稳健优化的最新进展:概述》,《欧洲运筹学杂志》,235,3,471-483(2014)·Zbl 1305.90390号
[18] 乔治安娜,S。;希利,P.J。;韦伯,R.A.,《论战略复杂性的持续性》,《经济理论杂志》,159,369-400(2015)·Zbl 1330.91016号
[19] 戈里克,M。;Schöbel,A.,稳健优化中的算法工程,算法工程,245-279(2016)
[20] Harsanyi,J.C.,《贝叶斯玩家玩的信息不完整的游戏第I-III部分》,《管理科学》,第14、3、159-182页(1967年)·Zbl 0207.51102号
[21] Lempert,R.J。;Collins,M.T.,管理不确定阈值响应的风险:稳健、最佳和预防方法的比较,风险分析,27,41009-1026(2007)
[22] 刘易斯,A.S。;Overton,M.L.,通过拟Newton方法进行非光滑优化,数学规划,141,1-2,135-163(2013)·Zbl 1280.90118号
[23] McKelvey,R.D。;Palfrey,T.R.,正规形式博弈的量子响应均衡,博弈与经济行为,10,1,6-38(1995)·Zbl 0832.90126号
[24] 莫拉维克,M。;马丁·S。;B.尼尔。;李斯,V。;达斯汀,M。;Nolan,B.,《Deepstack:专家级人工智能在头脑中的应用》,《科学》,第356、6337、508-513页(2017年)·Zbl 1403.68202号
[25] 冯·诺依曼,J.,《高等教育理论》,《数学年鉴》,100,1295-320(1928)·JFM 54.0543.02型
[26] Nguyen,T.H。;辛哈,A。;Tambe,M.,《解决安全游戏中的行为不确定性:防御巡逻的有效稳健战略解决方案》,IEEE国际并行和分布式处理研讨会论文集,1831-1838(2016)
[27] Nguyen,T.H。;辛哈,A。;Tambe,M.,《克服安全游戏中的对手行为不确定性:一种高效的建模稳健算法》,第三十届AAAI人工智能会议论文集,4242-4243(2016)
[28] Powell,W.B.,《随机优化的统一框架》,《欧洲运筹学杂志》,275,3,795-821(2019)·Zbl 1430.90445号
[29] 里奥斯·因苏阿,D。;Banks,D。;Rios,J.,《对抗性风险分析中的对手建模》,《风险分析》,36,4,742-755(2016)
[30] 罗杰斯,B.W。;Palfrey,T.R。;Camerer,C.F.,《异质量子响应平衡和认知层次》,《经济理论杂志》,1440-1467(2009)·Zbl 1166.91310号
[31] 谢林,T.C.,《冲突战略》(1960),哈佛大学出版社,马萨诸塞州剑桥
[32] Selten,R.,实验观察到的有限理性的特征,《欧洲经济评论》,42,413-436(1998)
[33] 斯塔尔·D·O。;Wilson,P.W.,《关于其他玩家的玩家模型:理论和实验证据》,《游戏与经济行为》,10,1,218-254(1995)·Zbl 0831.90135号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。