张凯庆;杨卓然;塔梅尔·巴沙尔 多智能体强化学习:理论和算法的选择性概述。 (英语) 兹伯利07608712 Vamvoudakis,Kyriakos G.(编辑)等人,《强化学习和控制手册》。查姆:斯普林格。研究系统。Decis公司。控制325321-384(2021)。MSC公司:68泰克 PDF格式BibTeX公司 XML格式引用 \textit{K.Zhang}等人,研究系统。Decis公司。控制325、321--384(2021;Zbl 07608712) 全文: DOI程序 arXiv公司
本·阿米特;安德烈亚·科列维奇奥;马克·斯卡西尼;钟子文 随机博弈中的纯纳什均衡和最佳响应动力学。 (英语) Zbl 1483.91028号 数学。操作人员。物件。 46,编号4,1552-1572(2021).MSC公司:91A15型 91A11号机组 91A06型 60K35型 PDF格式BibTeX公司 XML格式引用 \textit{B.Amiet}等人,数学。操作人员。第46号决议,第4号,1552--1572(2021;Zbl 1483.91028) 全文: DOI程序 arXiv公司
马晓白;Gupta,Jayesh K。;Mykel J.Kochenderfer。 规范多代理系统的流策略。 (英语) Zbl 1483.68422号 朱全燕(主编)等,《安全决策与博弈论》。第11届国际会议,2020年10月28日至30日,GameSec 2020,美国马里兰州大学公园。诉讼程序。查姆:斯普林格。莱克特。注释计算。科学。12513, 277-296 (2020).MSC公司:第68页第42页 68T05型 91A80型 93甲16 PDF格式BibTeX公司 XML格式引用 \textit{X.Ma}等人,Lect。注释计算。科学。12513,277--296(2020;Zbl 1483.68422) 全文: DOI程序
戈弗雷·凯勒;斯文·雷迪 不折不扣的强盗游戏。 (英语) 兹比尔1452.91058 游戏经济学。行为。 124, 43-61 (2020).MSC公司:91A60型 60G51型 PDF格式BibTeX公司 XML格式引用 \textit{G.Keller}和\textit{S.Rady},游戏经济。行为。124、43-61(2020;Zbl 1452.91058) 全文: DOI程序 arXiv公司
杜,叶;埃胡德·莱勒 受限的无更新学习。 (英语) Zbl 1437.91141号 数学杂志。经济。 2020年8月16日至24日.MSC公司:91B06型 PDF格式BibTeX公司 XML格式引用 \textit{Y.Du}和\textit{E.Lehrer},J.数学。经济。88、16-24(2020年;Zbl 1437.91141) 全文: DOI程序
Kovařík,沃伊特奇;维利亚姆·利斯 同时移动博弈中蒙特卡罗树搜索的Hannan一致选择分析。 (英语) Zbl 1440.68219号 机器。学习。 109,第1期,1-50页(2020年).MSC公司:68T05型 68T20型 91A10号 91A18号 91A26型 PDF格式BibTeX公司 XML格式引用 \textit{V.Kovařik}和\textit{V.Lisõ},马赫。学习。109,编号1,1-50(2020;Zbl 1440.68219) 全文: DOI程序 arXiv公司
苏加塔·乔杜里;特瓦里,安布杰 在线学习与top-k反馈进行排名。 (英语) Zbl 1435.68255号 J.马赫。学习。物件。 18(2017-2018),第103号论文,50页(2017).MSC公司:68T05型 68周27 91A60型 PDF格式BibTeX公司 XML格式引用 \textit{S.Chaudhuri}和\textit{A.Tewari},J.Mach。学习。第18号决议,第103号论文,50页(2017年;Zbl 1435.68255) 全文: arXiv公司 链接
王华(Wang,Hua);张晓宁 多区域间博弈论交通网络设计。 (英语) 兹比尔1397.90071 安·Oper。物件。 249,编号1-2,97-117(2017).MSC公司:90B06型 90B10型 91A65型 91A12号机组 PDF格式BibTeX公司 XML格式引用 \textit{H.Wang}和\textit{X.Zhang},Ann.Oper。第249号决议,第1--2号,第97-117号(2017年;Zbl 1397.90071) 全文: DOI程序
塞缪尔·巴雷特;阿维·罗森菲尔德;萨里特·克劳斯;彼得·斯通 动态交友:与新队友合作。 (英语) Zbl 1392.68411号 工件。智力。 242, 132-171 (2017).MSC公司:第68页第40页 68T05型 68T42型 PDF格式BibTeX公司 XML格式引用 \textit{S.Barrett}等人,Artif。智力。242132--171(2017;Zbl 1392.68411) 全文: DOI程序
马丁·霍弗;托马斯·凯塞尔海姆;博贾娜·柯德里克 机制与接纳同时合成的平滑度。 (英语) Zbl 1404.91025号 Cai,Yang(编辑)等人,《网络与互联网经济学》。2016年12月11日至14日,加拿大蒙特利尔,第十二届国际葡萄酒大会。诉讼程序。柏林:施普林格出版社(ISBN 978-3-662-54109-8/pbk;978-3-562-54110-4/电子书)。计算机科学课堂讲稿10123294-308(2016)。MSC公司:91A20型 91A26型 91B15号机组 PDF格式BibTeX公司 XML格式引用 \textit{M.Hoefer}等人,Lect。注释计算。科学。10123,294--308(2016;Zbl 1404.91025) 全文: DOI程序 arXiv公司
瓦利德·克里奇内;本杰明·德里斯;亚历山大·巴恩(Alexandre M.Bayen)。 拥挤游戏中纳什均衡的在线学习。 (英语) Zbl 1409.91013号 SIAM J.控制优化。 53,第2期,1056-1081(2015).MSC公司:91A10号 91级07 68周27 91A20型 91A26型 91-04 PDF格式BibTeX公司 XML格式引用 \textit{W.Krichene}等人,SIAM J.控制优化。53,第2号,1056--1081(2015;Zbl 1409.91013) 全文: DOI程序 arXiv公司 链接
Ioannis的Caragiannis;克里斯托斯·卡克拉曼尼斯;卡内洛普洛斯(Kanellopoulos)、帕纳吉奥蒂斯(Panagiotis);玛丽亚·基罗普洛;布伦丹·露西尔;佩斯·莱姆(Paes Leme)、雷纳托(Renato);埃瓦州塔尔多斯 限制广义二次价格拍卖结果的无效性。 (英语) Zbl 1314.91114号 《经济学杂志》。理论 156, 343-388 (2015).MSC公司:第91页第26页 91A80型 PDF格式BibTeX公司 XML格式引用 \textit{I.Caragiannis}等人,J.Econ。理论156,343--388(2015;Zbl 1314.91114) 全文: DOI程序 arXiv公司 链接
马丁·霍弗;西德哈特·苏里 网络互动游戏中的动力学。 (英语) Zbl 1256.91011号 分布计算。 第5号,第25页,第359-370页(2012年).MSC公司:91A40型 91A43型 91A05型 64岁以下 PDF格式BibTeX公司 XML格式引用 \textit{M.Hoefer}和\textit{S.Suri},分布计算。25,第5号,359--370(2012;Zbl 1256.91011) 全文: DOI程序
罗伯特·克莱伯格;乔治·皮里奥拉斯;埃瓦州塔尔多斯 公告板模型中的负载平衡没有遗憾。 (英语) Zbl 1231.68084号 分布计算。 24,第1期,21-29(2011).MSC公司:64岁以下 68平方米 91A80型 第68季度32 PDF格式BibTeX公司 XML格式引用 \textit{R.Kleinberg}等人,《分布计算》。24,第1号,第21--29号(2011;Zbl 1231.68084) 全文: DOI程序
克里斯蒂安·博格斯;詹妮弗·查耶斯;尼科尔·埃莫利卡;亚当·托曼·卡莱;瓦哈卜·米罗尼尼;克里斯托斯·帕帕迪米特里奥 民间定理的神话。 (英语) Zbl 1207.91012号 游戏经济学。行为。 70,第1期,34-43(2010).MSC公司:91A20个 91A05型 91B44型 65年第68季度 PDF格式BibTeX公司 XML格式引用 \textit{C.Borgs}等人,《游戏经济》。行为。70,编号1,34-43(2010;Zbl 1207.91012) 全文: DOI程序