×

使用逆优化来学习广义纳什对策中的成本函数。 (英语) Zbl 1512.91005号

总结:如所示L.J.拉特利夫等【“建筑节能的社会游戏:激励设计”,摘自:第52届Allerton通信、控制和计算年会论文集(Allerton)。新泽西州皮斯卡塔韦:IEEE控制系统学会;IEEE信息理论学会。1011–1018(2014;doi:10.1109/ALLERTON.2014.7028565)]逆优化可以用来恢复多层次纳什博弈中参与者的目标函数参数。这些博弈涉及多个参与者的优化问题,参与者可以在目标函数中相互影响。在广义纳什均衡问题(GNEP)中,玩家的可行行为集也会受到游戏中其他玩家所采取的行为的影响。我们扩展了Ratliff等人[loc.cit.]的框架,以找到一类称为联合凸GNEP的特定GNEP的逆优化解。然后将得到的公式应用于道路网络上的模拟多层运输问题。我们看到,我们的模型恢复了参数化,这些参数化产生了与原始参数化相同的流模式,并且这在多个网络中是成立的,关于参与者感知成本的不同假设,以及大多数限制性容量设置和相关的玩家数量。项目代码可在以下位置找到:https://github.com/sallen7/IO_GNEP.

MSC公司:

91A10号 非合作游戏
90C25型 凸面编程
90立方厘米 互补、平衡问题和变分不等式(有限维)(数学规划方面)
91A68型 算法博弈论与复杂性
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 拉文德拉·K·阿胡加。;Orlin,James B.,反向优化,Oper。决议,49,5,771-783(2001)·Zbl 1163.90764号
[2] 阿尼尔·阿斯瓦尼;沈左军;Siddiq,Auyon,带噪声数据的逆优化,Oper。决议,66,3,870-892(2018)·兹比尔1455.90111
[3] Awasthi,Chaitanya;Andrew Lamperski,带混合不等式约束的逆微分对策,(2020年美国控制会议,2020年美国管制会议,ACC(2020),IEEE),2182-2187
[4] 安德烈亚斯·伯曼;亚历山大·马丁;塞巴斯蒂安·波库塔;Schneider,Oskar,《逆向优化的在线学习方法》(2018),arXiv预印本arXiv:1810.12997
[5] Bärmann、Andreas、Pokutta、Sebastian、Schneider、Oskar,2017年。模拟专家:通过在线学习进行反向优化。参加:机器学习国际会议。第400-410页。
[6] 莫克塔尔S.巴扎拉。;哈尼夫·谢拉利(Hanif D.Sherali)。;Shetty,Chitharanjan M.,《非线性规划:理论和算法》(2013),John Wiley&Sons
[7] 贝尔西马斯、迪米特里斯;古普塔,维沙尔;Paschalidis,Ioannis Ch,使用逆优化的平衡数据驱动估计,数学。程序。,153, 2, 595-633 (2015) ·Zbl 1334.49017号
[8] 乌芒·巴斯卡;卡特里娜州利吉特;伦纳德·J·舒尔曼。;Swamy,Chaitanya,在不知道延迟函数的情况下实现网络路由游戏的目标平衡,games Econ。行为。,118, 533-569 (2019) ·Zbl 1429.91075号
[9] 约翰·R·伯奇(John R.Birge)。;Holmes,Derek F.,使用内点方法的两阶段随机线性规划的有效解,计算。最佳方案。申请。,1, 3, 245-276 (1992) ·Zbl 0792.90051号
[10] 斯蒂芬·博伊德;Vandenberghe,Lieven,凸优化(2004),剑桥大学出版社·Zbl 1058.90049号
[11] Chan,Timothy CY;蒂姆·克雷格(Tim Craig);Lee,Taewoo;Sharpe,Michael B.,广义逆多目标优化及其在癌症治疗中的应用,Oper。研究,62,3,680-695(2014)·Zbl 1302.90194号
[12] Timothy C.Y.Chan。;Kaw,Neal,约束参数恢复的逆优化,Eur.J.Oper。研究,282,2,415-427(2020)·Zbl 1430.90396号
[13] Timothy C.Y.Chan。;Lee,Taewoo;Terekhov,Daria,《逆向优化:封闭形式解、几何和拟合优度》,管理。科学。,65, 3, 1115-1135 (2019)
[14] 陈瑞迪;帕斯卡利迪斯,Ioannis Ch;Caramanis,Michael C.,《利用逆向优化在日前市场中对电力供应商进行战略均衡竞标》,(2017年IEEE第56届决策与控制年会,2017年IEEE第56届决定与控制年会刊,CDC(2017),IEEE),220-225
[15] Joseph Y.J.Chow。;Djavadian,Shadi,容量受限多式联运系统基于活动的市场均衡,交通运输。《Procedia研究》,7,2-23(2015)
[16] Joseph Y.J.Chow。;Recker,Will W.,带内生到达时间约束的反向优化,以校准家庭活动模式问题,交通运输。决议B,46,3463-479(2012年)
[17] Joseph Y.J.Chow。;斯蒂芬·里奇。;Jeong,Kyungsoo,商品-车辆解耦货运分配参数估计的非线性逆优化,交通运输。决议E:Logist。运输。版次67,71-91(2014)
[18] 科米内蒂,罗伯托;何塞·R·科雷亚。;斯蒂尔·摩西(Stier-Moses)、尼科拉斯(Nicolás E.),《使用原子播放器的网络游戏》(自动化、语言和编程国际学术讨论会(2006),斯普林格),第525-536页·Zbl 1223.91013号
[19] 理查德·科特尔(Richard W.Cottle)。;彭宗石;理查德·斯通,《线性互补问题》(1992),学术出版社:学术出版社·Zbl 0757.90078号
[20] Steven P.Dirkse。;Ferris,Michael C.,《路径求解器:混合互补问题的非单调稳定化方案》,Optim。方法软件。,5, 2, 123-156 (1995)
[21] 董朝生;陈毅然;曾波,通过在线学习实现广义逆优化,(神经信息处理系统进展(2018)),86-95
[22] Duin,C.W。;Volgenant,A.,Hamming距离下的一些逆优化问题,欧洲期刊Oper。研究,170,3,887-899(2006)·邮编1091.90065
[23] Eaves,B.Curtis,《关于互补性的基本定理》,《数学》。程序。,1, 1, 68-75 (1971) ·Zbl 0227.90044号
[24] Elvik,Rune,《道路使用者行为的游戏理论模型综述》,Accid。分析。上一篇。,62, 388-396 (2014)
[25] 埃斯法哈尼(Esfahani)、佩曼·莫哈杰林(Peyman Mohajerin);沙菲埃扎德·阿巴德(Shafieezadeh-Abadeh),索鲁什(Soroosh);格拉尼·哈纳苏桑托(Grani A.Hanasusanto)。;Kuhn,Daniel,具有不完全信息的数据驱动逆优化,数学。程序。,167, 1, 191-234 (2018) ·Zbl 1406.90087号
[26] 弗朗西斯科·法奇尼;安德烈亚斯·菲舍尔(Andreas Fischer);Piccialli,Veronica,关于广义Nash对策和变分不等式,Oper。Res.Lett.公司。,35, 2, 159-164 (2007) ·Zbl 1303.91020号
[27] 弗朗西斯科·法奇尼;Christian Kanzow,《广义纳什均衡问题》,Ann.Oper。第175号、第177-211号决议(2010年)·Zbl 1185.91016号
[28] 弗朗西斯科·法奇尼;Pang,Jong-Shi,有限维变分不等式和互补问题(2007),Springer Science&Business Media·Zbl 1062.90002号
[29] Fernández Blanco,里卡多;胡安·米盖尔·莫拉莱斯(Juan Miguel Morales);萨尔瓦多皮内达(Pineda,Salvador),通过相似逆优化预测建筑群的价格响应,应用。能源,290,第116791条pp.(2021)·Zbl 1511.90295号
[30] Michael C.Ferris。;Todd S.Munson,《GAMS中的互补问题和路径求解器》,J.Econom。发电机。控制,24,2,165-188(2000)·Zbl 1002.90070
[31] Michael C.Ferris。;Todd S.Munson,《路径4.7》(2020年),https://www.gams.com/latest/docs/S_PATH.html
[32] 史蒂文·加布里埃尔(Steven A.Gabriel)。;安东尼奥·科内乔(Antonio J.Conejo)。;J.David Fuller;本杰明·霍布斯(Benjamin F.Hobbs)。;Carlos Ruiz,《能源市场的互补建模》,第180卷(2012年),Springer Science&Business Media·Zbl 1296.90002号
[33] GAMS开发公司,通用代数建模系统(GAMS)发布33.2.0(2020),https://www.gams.com/download(下载)/
[34] GAMS开发公司,通用代数建模系统(GAMS)发布34.1.0(2021),https://www.gams.com/download(下载)/
[35] 基米亚·戈巴迪;Mahmoudzadeh,Houra,《使用逆优化推断线性可行区域》,欧洲期刊Oper。决议,290,3829-843(2021)·Zbl 1487.90478号
[36] Gurobi Optimization LLC,文档(2020),https://www.gurobi.com/documentation网站/
[37] Aric A.Hagberg、Daniel A.Schult、Pieter J.Swart,2008年。使用NetworkX探索网络结构、动态和功能。收录于:Varoquaux,Gaöl,Vaught,Travis,Millman,Jarrod(编辑),《第七届Python科学会议论文集》。美国加利福尼亚州帕萨迪纳,第11-15页。
[38] Harker,Patrick T.,广义Nash对策与拟变量不等式,Eur.J.Oper。Res.,54,1,81-94(1991年)·Zbl 0754.90070号
[39] 帕特里克·T·哈克。;Pang,Jong-Shi,有限维变分不等式和非线性互补问题:理论、算法和应用综述,数学。程序。,48, 1-3, 161-220 (1990) ·Zbl 0734.90098号
[40] 威廉·哈特(William E.Hart)。;卡尔·D·莱尔德。;Jean-Paul Watson;伍德拉夫,大卫·L·。;Gabriel A.Hackebeil。;Nicholson,Bethany L。;Siirola,John D.,Python中的Pyomo-Optimization建模,第67卷(2017),Springer Optimizion及其应用·Zbl 1370.90003号
[41] 威廉·哈特(William E.Hart)。;Jean-Paul Watson;Woodruff,David L.,Pyomo:用Python建模和求解数学程序,数学。程序。计算。,3, 3, 219 (2011)
[42] 菲利普·哈特曼;Stampacchia,Guido,关于非线性椭圆微分函数方程,数学学报。,115, 1, 271-310 (1966) ·Zbl 0142.38102号
[43] 雷蒙德·亨梅克;Onn,Shmuel;Weismantel,Robert,Nash-equilibria and N fold integer programming(2009),arXiv预印本arXiv:0903.4577·Zbl 1213.90180号
[44] 霍恩,R.A。;Johnson,C.R.,矩阵分析(1985),剑桥大学出版社·Zbl 0576.15001号
[45] Hunter,J.D.,Matplotlib:一个2D图形环境,Comput。科学。工程,9,3,90-95(2007)
[46] 约翰·亨特;Dale,Darren;开火,埃里克;迈克尔·德罗特布姆(Michael Droettboom);Matplotlib开发团队,Matplotlab.pyplot.box图(2020年),https://matplotlib.org/3.2.1/api/as_gen/matplotlib.pyplot.boxplot.html。四月
[47] 因加,斋罗;埃斯特·比肖夫;蒂莫西·莫洛伊(Timothy L.Molloy)。;迈克尔·弗拉德(Michael Flad);Hohmann,Sören,逆非合作线性二次微分对策的解集,IEEE控制系统。莱特。,3, 4, 871-876 (2019)
[48] 桑杰·贾恩;Arya,Nitin,逆容量约束运输问题,IOSR J.Math。,5, 4, 24-27 (2013) ·Zbl 1413.90035号
[49] Johnson,Charles R.,正定矩阵,Amer。数学。月刊,77,3,259-264(1970)·Zbl 0261.15012号
[50] 阿雷佐的Keshavarz;王,杨;Stephen Boyd,《计算凸目标函数》,(2011年IEEE智能控制国际研讨会(2011),IEEE),613-619
[51] 艾奥尼斯·康斯坦塔科普洛斯(Ioannis C.Konstantakopoulos)。;安德鲁·巴尔坎(Andrew R.Barkan)。;何世英;Veeravalli,Tanya;刘慧涵;Spanos,Costas,《改善智能基础设施中人机交互和能源效率的深度学习和游戏化方法》,应用。能源,237810-821(2019)
[52] 艾奥尼斯·康斯坦塔科普洛斯(Ioannis C.Konstantakopoulos)。;莉莲·拉特利夫(Lillian J.Ratliff)。;金、明;Sastry,S.Shankar;Spanos,Costas J.,《通过逆向优化的稳健效用学习框架》,IEEE Trans。控制系统。技术。,26, 3, 954-970 (2017)
[53] 沃洛德迈尔·库列舍夫(Volodymyr Kuleshov);Okke Schrijvers,《逆向博弈论:简洁游戏中的学习效用》,(网络与互联网经济学国际会议(2015),Springer),413-427·Zbl 1404.91059号
[54] 拉里·J·勒布朗(Larry J.LeBlanc)。;爱德华·莫洛克(Edward K.Morlok)。;Pierskalla,William P.,解决路网平衡交通分配问题的有效方法,交通运输。第9、5、309-318号决议(1975年)
[55] Barconvtol Gurobi Optimization有限责任公司(2021年)
[56] LLC古罗比优化,古罗比优化器参考手册(2021)
[57] 欧文·J·卢斯蒂格。;约翰·穆尔维(John M.Mulvey)。;Carpenter,Tamra J.,为内点方法制定两阶段随机程序,Oper。研究,39,5,757-770(1991)·Zbl 0739.90048号
[58] 帕特丽斯·马科特;Michael Patriksson,《交通平衡》(运筹学与管理科学手册,第14卷(2007年),爱思唯尔出版社),623-713·Zbl 1142.91300号
[59] Matlab,版本9.8.0.1323502(R2020年a),The MathWorks,Inc.:The MathWorks,Inc.马萨诸塞州纳蒂克
[60] McKinney,Wes等人,2010年。python中用于统计计算的数据结构。摘自:《第九届科学会议上的蟒蛇》,第445卷。德克萨斯州奥斯汀,第51-56页。
[61] 蒂莫西·莫洛伊(Timothy L.Molloy)。;杰森·福特(Jason J.Ford)。;Perez,Tristan,逆非合作微分对策,(2017 IEEE第56届决策与控制年会,2017 IEEE关于决策与控制的第56届年会,CDC(2017),IEEE),5602-5608
[62] Koichi Nabetani;曾,保罗;Fukushima,Masao,带共享约束的广义Nash均衡问题的参数化变分不等式方法,计算。最佳方案。申请。,48, 3, 423-452 (2011) ·Zbl 1220.90136号
[63] Nekipelov、Denis、Syrgkanis、Vasilis、Tardos、Eva,2015年。学习代理的计量经济学。摘自:第十六届ACM经济与计算会议记录。第1-18页。
[64] Nguyen,Thai Dung,鲁棒和逆优化在运输中的应用(2010),麻省理工学院(博士论文)
[65] Nguyen,Dinh Hoa,《通过逆向优化和区间分析进行P2P能源交易的合作学习》(2020年),arXiv预印本arXiv:2011.02609
[66] Olifont,Travis E.,《NumPy指南》(2006),Trelgol出版社:美国Trelgol出版社
[67] 阿里尔·奥达(Ariel Orda);罗,拉斐尔;Shimkin,Nahum,多用户通信网络中的竞争路由,IEEE/ACM Trans。净值。,1, 5, 510-521 (1993)
[68] 詹姆斯·奥尔特加(James M.Ortega)。;Rheinboldt,Werner C.,多变量非线性方程的迭代解(2000),SIAM·Zbl 0949.65053号
[69] 亚历山大·佩萨科维奇(Peysakhovich,Alexander);克里斯蒂安·克罗尔(Christian Kroer);Adam Lerer,鲁棒多智能体反事实预测,(神经信息处理系统进展(2019)),3077-3087
[70] 莉莲·拉特利夫(Lillian J.Ratliff)。;塞缪尔·巴登(Samuel A.Burden)。;Sastry,S.Shankar,《连续博弈中局部Nash均衡的表征与计算》,(2013年第51届Allerton通信、控制与计算年会,2013年第五十一届Allerton-Accommunication通信、控制和计算年会),Allerton(2013),IEEE,917-924
[71] 莉莲·拉特利夫(Lillian J.Ratliff)。;金、明;Konstantakopoulos,约阿尼斯C。;斯帕诺斯、科斯塔斯;Sastry,S.Shankar,《建筑能效的社会游戏:激励设计》,(2014年第52届Allerton通信、控制和计算年会,2014年第五十二届Allerten通信、控制与计算年会),Allerton(2014),IEEE,1011-1018
[72] 研究核心团队交通网络,研究交通网络(2020年),https://github.com/bstabler/TransportationNetworks。
[73] 西蒙·里桑格(Simon Risanger);斯坦·埃里克(Stein-Erik),弗莱顿(Fleten);Gabriel,Steven A.,寡头垄断电力市场的反向均衡分析,IEEE Trans。电力系统。,35, 6, 4159-4166 (2020)
[74] Rosen,J.Ben,凹n人博弈平衡点的存在性和唯一性,计量经济学:计量经济学协会,520-534(1965)·Zbl 0142.17603号
[75] 蒂姆·拉夫加登(Tim Roughgarden),《路线游戏》(Algorithmic Game Theory,2007),剑桥大学出版社·Zbl 1152.91329号
[76] 哈维尔·塞伊兹·加莱戈;Juan M.Morales,《使用反向优化对价格响应负荷进行短期预测》,IEEE Trans。智能电网,9,5,4805-4814(2017)
[77] 恩里科Siri;Siri,Silvia;Sacone,Simona,《受破坏性事件影响的网络上的累进流量分配程序》,(2020年欧洲控制会议,2020年欧洲管制会议,ECC(2020),IEEE),130-135
[78] 奥利弗·斯坦因(Oliver Stein);Sudermann-Merx,Nathan,《非合作运输问题和线性广义Nash博弈》,欧洲期刊Oper。第266、2543-553号决议(2018年)·Zbl 1403.91084号
[79] 谭英聪;达里亚·捷列霍夫;Andrew Delong,《从最优决策中学习线性规划》(2020),arXiv预印本arXiv:2006.08923
[80] 泰语、杰罗姆语;Bayen,Alexandre M.,路由博弈中边缘成本函数的可学习性,(2017 IEEE第56届决策与控制年会,2017 IEEE决策与控制第56届年会,CDC(2017),IEEE),6422-6429
[81] 泰语、杰罗姆语;Bayen,Alexandre M.,《计算变分不等式函数或凸目标函数:稳健方法》,J.Math。分析。申请。,457, 2, 1675-1695 (2018) ·Zbl 1415.91100号
[82] 泰语、杰罗姆语;哈里斯,轮辋;Bayen,Alexandre,《基于稀疏数据的流量平衡中延迟推断和控制的多凸方法》,(2015年美国控制会议,2015年美国管制会议,ACC(2015),IEEE),689-695
[83] 泡利·维塔宁(Pauli Virtanen);拉尔夫·戈默斯(Ralf Gommers);特拉维斯·E·奥列芬特。;马特·哈伯兰(Matt Haberland);雷迪,泰勒;大卫·库纳波(David Cournapeau);叶夫根尼·布罗夫斯基(Evgeni Burovski);Pearu Peterson;沃伦·韦克瑟(Warren Weckesser);乔纳森,布莱特;范德沃尔特,斯特凡·J·。;马修·布雷特;约书亚·威尔逊(Joshua Wilson);贾罗德·米尔曼,K。;尼古拉·马约洛夫;Andrew R.J.Nelson。;埃里克·琼斯;罗伯特·科恩;埃里克·拉尔森(Eric Larson);CJ Carey;伊尔汗,波拉特;冯瑜;埃里克·摩尔(Eric W.Moore)。;Jake VanderPlas;丹尼斯·拉萨尔德;约瑟夫·佩克托尔德(Josef Perktold);Robert Cimrman;伊恩·亨利克森;昆特罗,E.A。;查尔斯·R·哈里斯。;安妮·阿奇博尔德(Anne M.Archibald)。;安托尼奥·里贝罗。;费比安·佩德雷戈萨;保罗·范·穆布雷格特(Paul van Mulbregt);科学1。0.贡献者,Scipy 1.0:Python中科学计算的基本算法,自然方法,17,261-272(2020)
[84] 沃尔特,斯特凡·范德;科尔伯特,S.克里斯;Varoquaux,Gael,The NumPy array:高效数值计算的结构,计算。科学。工程,13,2,22-30(2011)
[85] Waugh,Kevin;布莱恩·齐巴特(Brian D.Ziebart)。;Bagnell,J.Andrew,《计算合理化:逆平衡问题》(2011年第28届机器学习国际会议)
[86] Waugh,Kevin;布莱恩·齐巴特(Brian D.Ziebart)。;Bagnell,J.Andrew,计算合理化:逆平衡问题(2013),arXiv预印本arXiv:1308.3506
[87] Eric W.Weisstein,2021a。矩阵范数,https://mathworld.wolfram.com/MatrixNorm.html网址,摘自MathWorld-A Wolfram Web资源。
[88] Eric W.Weisstein,2021b。正定矩阵,https://mathworld.wolfram.com/PositiveDefiniteMatrix.html,摘自MathWorld-A Wolfram Web资源。
[89] 徐素佳;穆迪·努里内贾德;赖雪波;Joseph YJ Chow,通过多智能体逆向运输问题进行网络学习,交通运输。科学。,52, 6, 1347-1364 (2018)
[90] 张建忠;健、金宝;唐春明,一类非线性互补问题的逆问题及其求解方法,计算。最佳方案。申请。,49, 2, 271-297 (2011) ·Zbl 1242.90269号
[91] 张静;Paschalidis,Ioannis Ch,通过多类运输网络中的逆优化对出行延迟成本函数进行数据驱动估计,(2017年IEEE第56届决策与控制年会,2017年IEEE第56届决定与控制年会刊,CDC(2017),IEEE),6295-6300
[92] 张静;Pourazarm,Sepideh;克里斯托斯·卡桑德拉斯(Christos G.Cassandras)。;Paschalidis,Ioannis Ch,《交通网络无政府状态的代价:数据驱动的评估和削减策略》,Proc。IEEE,106,4538-553(2018)
[93] 张,何;苏跃龙;彭丽慧;Yao,Danya,《博弈论在运输分析中的应用综述》(2010年计算机和信息应用国际会议,IEEE),152-157
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。