文件Zbl 1525.91007-zbMATH Open

MG-CNN：深度CNN预测矩阵游戏的鞍点。（英语）兹比尔1525.91007

神经网络。 156，49-57（2022）.

摘要：寻找矩阵对策的鞍点是一个经典问题，它出现在经济学、计算机科学和工程学等各个领域。标准的问题解决方法包括将问题表述为线性规划（LP）。然而，当需要解决许多实例时，这种方法似乎效率较低。在本文中，我们提出了一种基于卷积神经网络的方法，该方法能够预测博弈的策略轮廓（x，y）和最优值（v）。我们将这种方法称为矩阵博弈传统神经网络或MG-CNN。由于使用了全局池技术，MG-CNN可以解决不同形状的矩阵游戏。我们提出了一种专门的MG-CNN训练算法，包括数据生成和模型训练。我们的数值实验表明，MG-CNN在计算CPU时间方面优于标准LP求解器，并提供了高质量的预测。

引用于1文件

MSC公司：

91年10月	非合作游戏
91A05型	2人游戏
68T07型	人工神经网络与深度学习

关键词：

卷积神经网络;鞍点;矩阵对策

软件：

AlexNet公司;效率网;古罗比;GLPK公司;优化软件基准;SCS公司;DGM公司;ECOS公司;亚当;PyTorch公司;ImageNet公司;BERT（误码率）;现金支出

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	Alzubaidi，L。；张杰。；胡迈迪，A.J。；Al-Dujali，A。；Duan，Y。；Al-Shamma，O.，《深度学习回顾：概念、CNN架构、挑战、应用、未来方向》，《大数据杂志》，第8期，第1-74页（2021年）
[2]	Bertsimas，D。；Tsitsiklis，J.N.，《线性优化导论》，第6卷（1997），雅典娜科学贝尔蒙特：雅典娜科技贝尔蒙特马萨诸塞州
[3]	O.布伦丹。；埃里克·C。；Neal，P。；Stephen，B.，通过齐次自对偶嵌入实现二次曲线优化的算子分裂，优化理论与应用杂志，1691042-1068（2016）·Zbl 1342.90136号
[4]	Cheng，J。；梁，J。；Lisser，A.，带联合机会约束的随机-对弈两人零和博弈，《欧洲运筹学杂志》，252，213-219（2016）·Zbl 1346.91004号
[5]	I.G.库维尔。；Y.本吉奥。；Aaron，A.，《深度学习》，《自然》，29，1-73（2016），网址：http://www.deeplearningbook.org ·Zbl 1373.68009号
[6]	Dantzig，G.B.，线性规划和扩展（1963年），兰德公司：兰德公司，加利福尼亚州圣莫尼卡·Zbl 0108.33103号
[7]	达斯古普塔，P。；Collins，J.B.，《网络安全任务中对抗性机器学习的博弈论方法调查》，AI杂志，40，31-43（2019），arXiv:1912.02258
[8]	德夫林，J。；Chang，M。；Lee，K。；Toutanova，K.，BERT:语言理解深度双向转换器的预训练，CoRR（2018），网址：http://arxiv.org/abs/1810.04805
[9]	戴蒙德，S。；Boyd，S.，CVXPY:一种嵌入Python的凸优化建模语言，《机器学习研究杂志》，17，1-5（2016）·Zbl 1360.90008号
[10]	Dixit，A.K。；Pindyck，R.S.，《不确定性下的投资》，1-468（2012），普林斯顿大学出版社
[11]	Domahidi，A。；朱，E。；Boyd，S.，ECOS:嵌入式系统的SOCP求解器，（2013年欧洲控制会议（2013），IEEE），3071-3076
[12]	福登堡，D。；Tirole，J.，《博弈论》（1991），麻省理工学院出版社·Zbl 1339.91001号
[13]	Glpk，D.，GNU线性编程工具包（2012年），网址：http://www.gnu.org/software/glpk/glpk.html
[14]	古德费罗，I。；Y.本吉奥。；A.Courville，《深度学习》（2016），麻省理工学院出版社，http://www.deeplearningbook.org ·Zbl 1373.68009号
[15]	古德费罗，I。；Pouget-Abadie，J。；米尔扎，M。；徐，B。；Warde-Farley，D。；Ozair，S.，《生成性对抗网络》，《ACM通信》，63，139-144（2020），arXiv:1406.2661
[16]	Gurobi Optimization，LLC，I.，古罗比优化器参考手册（2021），URL:https://www.gurobi.com网站
[17]	He，K。；张，X。；任，S。；Sun，J.，图像识别的深度残差学习，（IEEE计算机学会计算机视觉和模式识别会议论文集，2016-Decem（2016）），770-778，arXiv:1512.03385
[18]	黄，G。；刘，Z。；Van Der Maaten，L。；Weinberger，K.Q.，《紧密连接卷积网络》（Proceedings-30th IEEE conference on computer vision and pattern recognition，Vol.2017-Janua（2017）），2261-2269，arXiv:1608.06993
[19]	Jared L、Adair、Kristin L、Detry、Richard J、Durfee、Justin D、Jones，K.和A、Martin，N.（2012）。开源线性规划求解器的比较。美国：http://dx.doi.org/10.2172/104761。
[20]	Jumper，J。；埃文斯，R。；Pritzel，A。；格林，T。；菲格诺夫，M。；Ronneberger，O.，《利用AlphaFold进行高精度蛋白质结构预测》，《自然》，596583-589（2021）
[21]	Karmarkar，N.（1984）。线性规划的一种新的多项式时间算法。第十六届ACM计算理论研讨会论文集（第302-311页）·Zbl 0557.90065号
[22]	Khan，A。；Sohail，A。；Zahoora，美国。；Qureshi，A.S.，深度卷积神经网络最新架构的调查，《人工智能评论》，53，5455-5516（2020）
[23]	Kingma，D.P。；Ba，J.，Adam：随机优化方法（2014），arXiv预印本arXiv:1412.6980
[24]	Krizhevsky，A。；Sutskever，I。；Hinton，G.E.，用深度卷积神经网络进行ImageNet分类，ACM通信，60，84-90（2017）
[25]	LeCun，Y。；Bengio，Y.，图像、语音和时间序列的卷积网络，（脑理论和神经网络手册，3361（1995）），255-258，网址：网址：http://www.iro.umontreal.ca/lisa/pointeurs/handbook-convo.pdf
[26]	Mittelmann，H.D.，优化软件基准（2022），网址：http://plato.asu.edu/bench.html
[27]	Nash，J.F.，n人游戏中的平衡点，国家科学院学报，36，48-49（1950）·Zbl 0036.01104号
[28]	冯·诺依曼（von Neumann，J.），《数学年鉴》（Mathematische Annalen），第100期，第295-320页（1928年）
[29]	Paszke，A。；毛重，S。；马萨，F。；Lerer，A。；布拉德伯里，J。；Chanan，G.，PyTorch:一个命令式、高性能的深度学习库，（Wallach，H.，Larochelle，H.；Beygelzimer，A.；d Alché-Buc，F.；Fox，E.；Garnett，R.，《神经信息处理系统的进展》，第32卷（2019年），Curran Associates，Inc.），网址：https://proceedings.neurips.cc/paper/2019/file/bdbca288fee7f92f2bfa9f7012727740-paper.pdf，arXiv:1912.01703
[30]	西尔弗·D。；黄，A。；Maddison，C.J。；盖兹，A。；Sifre，L。；van den Driessche，G.，《用深度神经网络和树搜索掌握围棋游戏》，《自然》，529，484-489（2016）
[31]	Simmons，G.，《投资科学，管理决策》，36，419-420（1998），网址：https://ecopapers.repec.org/repec:oxp:obooks:9780195108095
[32]	Singh，H.，博弈论及其在电力市场中的应用导论，IEEE计算机在电力中的应用，12，18-20（1999）
[33]	辛格，V.V。；Lisser，A.，《机会约束下两人零和博弈的二阶锥规划公式》，《欧洲运筹学杂志》，275839-845（2019）·Zbl 1431.91006号
[34]	西里尼亚诺，J。；Spiliopoulos，K.，DGM：解偏微分方程的深度学习算法，计算物理杂志，3751339-1364（2018）·Zbl 1416.65394号
[35]	Tan，M。；Le，Q.V.，EfficientNet:卷积神经网络模型缩放的再思考（2019），网址：https://arxiv.org/abs/1905.11946
[36]	Tembine，H.，《深度学习与博弈论：交互式深度生成对抗网络的基于Bregman的算法》，IEEE控制论汇刊，50，1132-1145（2020）
[37]	Vanderbei，R.J.，整数规划，（线性规划（2014），Springer），345-362
[38]	Vega-Redondo，F.，《经济学与博弈论》，1-512（2003年），CRC出版社
[39]	Wright，S.J.，《Primal-双重内点法》（1997），SIAM·Zbl 0863.65031号
[40]	Wu，D。；Lisser，A.，求解随机双层零和博弈的动态神经网络方法，神经网络（2022）·Zbl 1523.91005号
[41]	Wu，D。；Lisser，A.，《使用CNN解决两人零和博弈》，《专家系统与应用》，第117545页，（2022）
[42]	Xu，Y。；Zhang，H.，深度卷积神经网络的收敛性，神经网络（2022）·Zbl 1530.68233号
[43]	张，S。；姚，L。；Sun，A。；Tay，Y.，基于深度学习的推荐系统：调查和新视角，ACM计算调查，52，1-38（2019）
[44]	周，Y。；Kantarcioglu，M。；Xi，B.，对抗性机器学习的博弈论方法综述，威利跨学科评论：数据挖掘和知识发现，9，文章e1259 pp.（2019）

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
拉	语言
所以	来源
实验室	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!实验室	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

MG-CNN：深度CNN预测矩阵游戏的鞍点。（英语）兹比尔1525.91007

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

MG-CNN：深度CNN预测矩阵游戏的鞍点。 （英语） 兹比尔1525.91007

MSC公司：

关键词：

软件：

参考文献：

MG-CNN：深度CNN预测矩阵游戏的鞍点。（英语）兹比尔1525.91007