×

通过人口博弈解决maxmin优化问题。 (英语) 兹伯利07846601

概述:人口博弈是一种具有有限组可用策略和无限个参与者的博弈,其中选择给定策略的回报是参与者对策略的分布函数。本文表明,在一类极大极小优化问题中,可以将一个人口博弈与一个给定的极大极小问题关联起来,这样就可以从关联博弈的纳什均衡中找到优化问题的解。然后,可以从微分方程组导出maxmin优化问题的迭代求解方法,这些微分方程组的轨迹已知会收敛到Nash均衡。特别是,我们使用了进化博弈论中著名的复制方程的离散时间版本,在机器学习中也称为指数乘法权重算法。所得算法可视为迭代重加权最小二乘(IRLS)方法的推广,该方法在数值分析中是一种在有限网格上解决切比雪夫函数逼近问题的有用技术。举例说明了广义IRLS方法在集体投资和模型不确定性决策中的应用。

MSC公司:

90C29型 多目标规划
90立方厘米 数学规划中的极小极大问题
91A14号机组 潜在和拥堵游戏
91A22个 进化游戏
91B15号机组 福利经济学
91B69型 异构代理模型
91G10型 投资组合理论
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] 阿罗拉,S。;哈赞,E。;Kale,S.,乘法权重更新方法:元算法及其应用,理论计算。,2012年12月8日至16日·Zbl 1283.68414号
[2] Aubin,JP,Optima and Equilibria.非线性分析导论,1998,柏林:施普林格出版社,柏林·Zbl 0930.91001号
[3] Bajeux-Besnainou,I。;Portait,R.,《基准投资组合:金融理论的新视角》,《欧洲金融杂志》。,3, 291-309, 1997
[4] Balter,A.G.,Schumacher,J.M.,Schweizer,N.:测试游戏中纳什均衡的动态稳定性(2023)。ssrn.com/abstract=4264872
[5] Balter,A.G.、Schumacher,J.M.、Schweizer,N.:模糊决策、组合优化和量子响应平衡(2024)。准备中的手稿
[6] Balter,A.G.,Schweizer,N.:通过确定性等价物对异质代理进行稳健决策(2021年)。ArXiv公司:2106.13059
[7] Basak,S.,《投资组合保险的一般均衡模型》,《金融评论》。螺柱,81059-10901995
[8] 鲍姆,LE;Eagon,JA,《一个不等式及其在马尔可夫过程概率函数统计估计和生态学模型中的应用》,布尔。美国数学。Soc.,73360-3631967年·Zbl 0157.11101号
[9] Ben-Tal,A。;El Ghaoui,L。;Nemirovski,A.,《稳健优化》,2009年,新泽西州普林斯顿:普林斯顿大学出版社,新泽西普林斯顿·Zbl 1221.90001号
[10] Berge,C.:拓扑空间。包括多值函数、向量空间和凸性的处理。Oliver&Boyd,伦敦(1963年)。E.M.Patterson对法语原文的英译本,Espace Topologiques,Foctions Multivoques,Dunod,巴黎,1959·Zbl 0114.38602号
[11] 伯克勒,AB;库文伯格,R。;Post,T.,《损失厌恶下的最优投资组合选择》,《经济学评论》。统计,86,973-9872004
[12] 伯纳德,C。;陈,JS;Vanduffel,S.,《合理化投资者的选择》,J.Math。经济。,59, 10-23, 2015 ·Zbl 1320.91132号
[13] 卞,B。;Zheng,H.,具有一般效用函数的投资模型的收费公路性质和收敛速度,J.Econ。动态。对照组,2015年第51期,第28-49页·Zbl 1402.91339号
[14] Bomze,IM,《生物非合作两人游戏:分类》,《国际》。J.博弈论,15,31-571986·Zbl 0594.90098号
[15] 布朗,GW;科普曼斯,TC,通过虚拟游戏迭代求解游戏,生产和分配活动分析,374-3761951,纽约:威利,纽约·Zbl 0045.09902号
[16] 布朗,GW;冯·诺依曼,J。;库恩,HW;塔克,AW,微分方程的对策解,对对策理论的贡献I,数学研究年鉴,73-791950,新泽西州普林斯顿:普林斯顿大学出版社,新泽西州普林斯顿·Zbl 0041.25502号
[17] Burrus,CS公司;巴雷托,JA;Selesnick,IW,FIR滤波器的迭代重加权最小二乘设计,IEEE Trans。信号处理。,42, 2926-2936, 1994
[18] Carassus,L.,Pham,H.:分段凹准则函数的投资组合优化。收录于:S.Ogawa(编辑)第八期随机数值研讨会,RIMS Kokyuroku系列1620,第81-111页。京都大学(2009)
[19] Cressman,R.,《进化动力学和扩展形式游戏》,2003年,马萨诸塞州剑桥:麻省理工学院出版社,马萨诸塞诸塞州坎布里奇·Zbl 1067.91001号
[20] Daubechies,I。;DeVore,R。;Fornasier,M。;Güntürk,CS,稀疏恢复的迭代重加权最小二乘最小化,Commun。纯应用程序。数学。,63, 1-38, 2010 ·兹比尔1202.65046
[21] Delbaen,F。;Schachermayer,W.,《套利数学》,2006年,柏林:施普林格出版社,柏林·Zbl 1106.91031号
[22] Desmettre,S。;Steffensen,M.,具有随机风险规避的均衡投资,数学。财务。,33, 946-975, 2023
[23] Ehrgott,M.,《多准则优化》,2005年,柏林:施普林格出版社,柏林·Zbl 1132.90001号
[24] 弗伦德,Y。;夏皮雷,RE,使用乘法权重的自适应游戏,游戏经济。行为。,29, 79-103, 1999 ·Zbl 0964.91007号
[25] 福登堡,D。;莱文,DK,《游戏中的学习理论》,1998年,马萨诸塞州剑桥:麻省理工学院出版社·Zbl 0939.91004号
[26] Fulton,W.,《代数拓扑》。第一门课程,1995年,纽约:施普林格,纽约·Zbl 0852.55001号
[27] 高,B。;Pavel,L.,《关于多智能体有限游戏中的被动性、强化学习和高阶学习》,IEEE Trans。自动。控制,66121-1362020·Zbl 07320136号
[28] Green,PJ,迭代重加权最小二乘法以进行最大似然估计,以及一些稳健且有抵抗力的替代方法,J.Roy。统计社会:序号。B(Methodol.),第46页,第2页,第149-170页,1984年·Zbl 0555.62028号
[29] Harsanyi,JC,《红衣主教福利、个人主义伦理和人际效用比较》,《政治经济学杂志》。,1955年第63页第309页至第321页
[30] Harsanyi,JC,最大原则能作为道德的基础吗?对约翰·罗尔斯理论的批判,《美国政治学》。科学。修订版,69594-6061975
[31] 霍夫鲍尔,J。;桑德霍姆,WH,《稳定游戏及其动力学》,J.Econ。理论,1441665-16932009·Zbl 1175.91036号
[32] 霍夫鲍尔,J。;Sigmund,K.,《进化与动力系统理论》。选择的数学方面。,1988年,纽约:剑桥大学出版社,纽约·Zbl 0678.92010号
[33] 霍夫鲍尔,J。;Sigmund,K.,进化博弈动力学,公牛。美国数学。Soc.,40479-5192003年·兹比尔1049.91025
[34] Jahn,J.,向量优化,2011年,柏林:施普林格出版社,柏林·Zbl 1401.90206号
[35] Jeffreys,H.:关于地震学中的旅行时间。中央科学局国际出版物,Série A,Travaux Scientifiques 14,3-86(1936)。转载于:《哈罗德·杰弗里斯爵士关于地球物理和其他科学的论文集》,戈登和布雷奇,纽约,1973年
[36] 库恩,HW;Kuenne,RE,空间经济学中广义Weber问题数值解的有效算法,J.Reg.Sci。,4, 2, 21-33, 1962
[37] 劳森,C.L.:对线性最小最大近似理论的贡献。加州大学洛杉矶分校博士论文(1961年)
[38] 莱曼,EL;Casella,G.,《点估计理论》,2006年,纽约:Springer,纽约
[39] 列昂纳多斯,S。;Piliouras,G.,《多智能体学习中的探索开发:灾难理论与博弈论的结合》,Artif。智力。,304, 103653, 2022 ·Zbl 07482905号
[40] 北卡罗来纳州利特斯通,当不相关的属性大量存在时快速学习:一种新的线性阈值算法,马赫。学习。,2, 285-318, 1988
[41] Manski,CF,异质人群的统计处理规则,计量经济学,721221-12462004·Zbl 1142.62308号
[42] 梅纳德·史密斯(Maynard Smith,J.)。;Price,GR,《动物冲突的逻辑》,《自然》,第246、5427、15-18页,1973年·兹比尔1369.92134
[43] Mazumdar,E。;拉特利夫,LJ;Sastry,SS,《关于连续游戏中基于梯度的学习》,SIAM J.Math。数据科学。,2, 103-131, 2020 ·Zbl 1517.91003号
[44] Y.Nakatsukasa。;Trefethen,LN,《实有理和复有理极大极小逼近算法》,SIAM J.Sci。计算。,42,A3157-A31792020·Zbl 1452.65035号
[45] 内尔德,JA;Wedderburn,RWM,广义线性模型,J.R.Stat.Soc.Ser。A、 135370-3841972年
[46] 帕克翁,R。;chebfun系统最佳多项式逼近的Trefethen、LN、重心-Remez算法,BIT-Numer。数学。,49, 721-741, 2009 ·兹比尔1179.65012
[47] Panageas,I.,Piliouras,G.,Wang,X.:乘法权重更新为分布式约束优化算法:几乎总是收敛到二阶平稳点。收录于:K.Chaudhuri,R.Salakhutdinov(编辑)《第36届机器学习国际会议论文集》(加州长滩,2019年6月9日至15日),PMLR 97,第4961-4969页。MLR出版社(2019)
[48] Pascucci,A.,《期权定价中的PDE和鞅方法》,2011年,米兰:Springer,米兰·Zbl 1214.91002号
[49] 菲尔普斯,S。;McBurney,P。;Parsons,S.,《进化机制设计:综述》,Auton。代理人。多代理系统。,21, 237-264, 2010
[50] Piliouras,G.,Sim,R.,Skoulakis,S.:超越时间平均收敛:通过千里眼乘法权重更新的近最优非耦合在线学习(2022)。阿西夫:2111.144737v4
[51] del Pino,G.,《统计算法中迭代广义最小二乘的统一作用》,《统计科学》。,4, 394-403, 1989
[52] 罗尔斯,J.,《正义理论》,1971年,马萨诸塞州坎布里奇:贝尔纳普出版社
[53] 赖斯,JR;Usow,KH,The Lawson algorithm and extensions,数学。计算。,22, 118-127, 1968 ·Zbl 0155.21902号
[54] 罗宾逊,J.,《求解游戏的迭代方法》,《数学年鉴》。,54, 296-301, 1951 ·兹比尔0045.08203
[55] 罗宾逊,SM;Day,RH,数学规划中最优集连续的一个充分条件,J.Math。分析。申请。,45, 506-511, 1974 ·Zbl 0291.90063号
[56] Rustichini,A.,《刺激-反应学习模型的最佳特性》,《游戏经济学》。行为。,29, 244-273, 1999 ·Zbl 1131.91308号
[57] 桑德霍姆,WH,《偏好演化,双速动力学和快速社会变革》,《经济学评论》。动态。,4, 637-679, 2001
[58] 桑德霍姆,WH,《人口游戏与进化动力学》,2010年,马萨诸塞州剑桥:麻省理工学院出版社,马萨诸塞诸塞州坎布里奇·Zbl 1208.91003号
[59] Sandholm,W.H.:人口博弈与确定性进化动力学。摘自:H.P.Young,S.Zamir(编辑)《经济应用博弈论手册》,第4卷,第13章,第703-778页。Elsevier,阿姆斯特丹(2015)
[60] Schlossmacher,EJ,绝对偏差曲线拟合的迭代技术,J.Am.Stat.Assoc.,68344857-8591973·Zbl 0287.62038号
[61] 斯特拉扎克,D。;Vishnoi,NK,《迭代加权最小二乘法和黏菌动力学:连接和收敛》,数学。程序。,194, 685-717, 2022 ·Zbl 1501.37083号
[62] PD泰勒;Jonker,L.,游戏动力学和进化稳定策略,数学。生物科学。,40, 145-156, 1978 ·Zbl 0395.90118号
[63] Wald,A.,《对统计估计理论和检验假设的贡献》,《数学年鉴》。统计,10,299-3261939
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。