×

MG-CNN:深度CNN预测矩阵游戏的鞍点。 (英语) 兹比尔1525.91007

摘要:寻找矩阵对策的鞍点是一个经典问题,它出现在经济学、计算机科学和工程学等各个领域。标准的问题解决方法包括将问题表述为线性规划(LP)。然而,当需要解决许多实例时,这种方法似乎效率较低。在本文中,我们提出了一种基于卷积神经网络的方法,该方法能够预测博弈的策略轮廓(x,y)和最优值(v)。我们将这种方法称为矩阵博弈传统神经网络或MG-CNN。由于使用了全局池技术,MG-CNN可以解决不同形状的矩阵游戏。我们提出了一种专门的MG-CNN训练算法,包括数据生成和模型训练。我们的数值实验表明,MG-CNN在计算CPU时间方面优于标准LP求解器,并提供了高质量的预测。

MSC公司:

91年10月 非合作游戏
91A05型 2人游戏
68T07型 人工神经网络与深度学习
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Alzubaidi,L。;张杰。;胡迈迪,A.J。;Al-Dujali,A。;Duan,Y。;Al-Shamma,O.,《深度学习回顾:概念、CNN架构、挑战、应用、未来方向》,《大数据杂志》,第8期,第1-74页(2021年)
[2] Bertsimas,D。;Tsitsiklis,J.N.,《线性优化导论》,第6卷(1997),雅典娜科学贝尔蒙特:雅典娜科技贝尔蒙特马萨诸塞州
[3] O.布伦丹。;埃里克·C。;Neal,P。;Stephen,B.,通过齐次自对偶嵌入实现二次曲线优化的算子分裂,优化理论与应用杂志,1691042-1068(2016)·Zbl 1342.90136号
[4] Cheng,J。;梁,J。;Lisser,A.,带联合机会约束的随机-对弈两人零和博弈,《欧洲运筹学杂志》,252,213-219(2016)·Zbl 1346.91004号
[5] I.G.库维尔。;Y.本吉奥。;Aaron,A.,《深度学习》,《自然》,29,1-73(2016),网址:http://www.deeplearningbook.org ·Zbl 1373.68009号
[6] Dantzig,G.B.,线性规划和扩展(1963年),兰德公司:兰德公司,加利福尼亚州圣莫尼卡·Zbl 0108.33103号
[7] 达斯古普塔,P。;Collins,J.B.,《网络安全任务中对抗性机器学习的博弈论方法调查》,AI杂志,40,31-43(2019),arXiv:1912.02258
[8] 德夫林,J。;Chang,M。;Lee,K。;Toutanova,K.,BERT:语言理解深度双向转换器的预训练,CoRR(2018),网址:http://arxiv.org/abs/1810.04805
[9] 戴蒙德,S。;Boyd,S.,CVXPY:一种嵌入Python的凸优化建模语言,《机器学习研究杂志》,17,1-5(2016)·Zbl 1360.90008号
[10] Dixit,A.K。;Pindyck,R.S.,《不确定性下的投资》,1-468(2012),普林斯顿大学出版社
[11] Domahidi,A。;朱,E。;Boyd,S.,ECOS:嵌入式系统的SOCP求解器,(2013年欧洲控制会议(2013),IEEE),3071-3076
[12] 福登堡,D。;Tirole,J.,《博弈论》(1991),麻省理工学院出版社·Zbl 1339.91001号
[13] Glpk,D.,GNU线性编程工具包(2012年),网址:http://www.gnu.org/software/glpk/glpk.html
[14] 古德费罗,I。;Y.本吉奥。;A.Courville,《深度学习》(2016),麻省理工学院出版社,http://www.deeplearningbook.org ·Zbl 1373.68009号
[15] 古德费罗,I。;Pouget-Abadie,J。;米尔扎,M。;徐,B。;Warde-Farley,D。;Ozair,S.,《生成性对抗网络》,《ACM通信》,63,139-144(2020),arXiv:1406.2661
[16] Gurobi Optimization,LLC,I.,古罗比优化器参考手册(2021),URL:https://www.gurobi.com网站
[17] He,K。;张,X。;任,S。;Sun,J.,图像识别的深度残差学习,(IEEE计算机学会计算机视觉和模式识别会议论文集,2016-Decem(2016)),770-778,arXiv:1512.03385
[18] 黄,G。;刘,Z。;Van Der Maaten,L。;Weinberger,K.Q.,《紧密连接卷积网络》(Proceedings-30th IEEE conference on computer vision and pattern recognition,Vol.2017-Janua(2017)),2261-2269,arXiv:1608.06993
[19] Jared L、Adair、Kristin L、Detry、Richard J、Durfee、Justin D、Jones,K.和A、Martin,N.(2012)。开源线性规划求解器的比较。美国:http://dx.doi.org/10.2172/104761。
[20] Jumper,J。;埃文斯,R。;Pritzel,A。;格林,T。;菲格诺夫,M。;Ronneberger,O.,《利用AlphaFold进行高精度蛋白质结构预测》,《自然》,596583-589(2021)
[21] Karmarkar,N.(1984)。线性规划的一种新的多项式时间算法。第十六届ACM计算理论研讨会论文集(第302-311页)·Zbl 0557.90065号
[22] Khan,A。;Sohail,A。;Zahoora,美国。;Qureshi,A.S.,深度卷积神经网络最新架构的调查,《人工智能评论》,53,5455-5516(2020)
[23] Kingma,D.P。;Ba,J.,Adam:随机优化方法(2014),arXiv预印本arXiv:1412.6980
[24] Krizhevsky,A。;Sutskever,I。;Hinton,G.E.,用深度卷积神经网络进行ImageNet分类,ACM通信,60,84-90(2017)
[25] LeCun,Y。;Bengio,Y.,图像、语音和时间序列的卷积网络,(脑理论和神经网络手册,3361(1995)),255-258,网址:网址:http://www.iro.umontreal.ca/lisa/pointeurs/handbook-convo.pdf
[26] Mittelmann,H.D.,优化软件基准(2022),网址:http://plato.asu.edu/bench.html
[27] Nash,J.F.,n人游戏中的平衡点,国家科学院学报,36,48-49(1950)·Zbl 0036.01104号
[28] 冯·诺依曼(von Neumann,J.),《数学年鉴》(Mathematische Annalen),第100期,第295-320页(1928年)
[29] Paszke,A。;毛重,S。;马萨,F。;Lerer,A。;布拉德伯里,J。;Chanan,G.,PyTorch:一个命令式、高性能的深度学习库,(Wallach,H.,Larochelle,H.;Beygelzimer,A.;d Alché-Buc,F.;Fox,E.;Garnett,R.,《神经信息处理系统的进展》,第32卷(2019年),Curran Associates,Inc.),网址:https://proceedings.neurips.cc/paper/2019/file/bdbca288fee7f92f2bfa9f7012727740-paper.pdf,arXiv:1912.01703
[30] 西尔弗·D。;黄,A。;Maddison,C.J。;盖兹,A。;Sifre,L。;van den Driessche,G.,《用深度神经网络和树搜索掌握围棋游戏》,《自然》,529,484-489(2016)
[31] Simmons,G.,《投资科学,管理决策》,36,419-420(1998),网址:https://ecopapers.repec.org/repec:oxp:obooks:9780195108095
[32] Singh,H.,博弈论及其在电力市场中的应用导论,IEEE计算机在电力中的应用,12,18-20(1999)
[33] 辛格,V.V。;Lisser,A.,《机会约束下两人零和博弈的二阶锥规划公式》,《欧洲运筹学杂志》,275839-845(2019)·Zbl 1431.91006号
[34] 西里尼亚诺,J。;Spiliopoulos,K.,DGM:解偏微分方程的深度学习算法,计算物理杂志,3751339-1364(2018)·Zbl 1416.65394号
[35] Tan,M。;Le,Q.V.,EfficientNet:卷积神经网络模型缩放的再思考(2019),网址:https://arxiv.org/abs/1905.11946
[36] Tembine,H.,《深度学习与博弈论:交互式深度生成对抗网络的基于Bregman的算法》,IEEE控制论汇刊,50,1132-1145(2020)
[37] Vanderbei,R.J.,整数规划,(线性规划(2014),Springer),345-362
[38] Vega-Redondo,F.,《经济学与博弈论》,1-512(2003年),CRC出版社
[39] Wright,S.J.,《Primal-双重内点法》(1997),SIAM·Zbl 0863.65031号
[40] Wu,D。;Lisser,A.,求解随机双层零和博弈的动态神经网络方法,神经网络(2022)·Zbl 1523.91005号
[41] Wu,D。;Lisser,A.,《使用CNN解决两人零和博弈》,《专家系统与应用》,第117545页,(2022)
[42] Xu,Y。;Zhang,H.,深度卷积神经网络的收敛性,神经网络(2022)·Zbl 1530.68233号
[43] 张,S。;姚,L。;Sun,A。;Tay,Y.,基于深度学习的推荐系统:调查和新视角,ACM计算调查,52,1-38(2019)
[44] 周,Y。;Kantarcioglu,M。;Xi,B.,对抗性机器学习的博弈论方法综述,威利跨学科评论:数据挖掘和知识发现,9,文章e1259 pp.(2019)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。