{“状态”：“确定”，“消息类型”：“工作”，“信息版本”：“1.0.0”，“邮件”：{“索引”：{-“日期-部件”：[[2024,6,14]]，“日期-时间”：“2024-06-14T21:14:11Z”，“时间戳”：1718399651943}，“参考-计数”：312，“出版商”：“Springer Science and Business Media LLC”，“发行”：“3”，“许可证”：[{“开始”：{-date-parts”：[[2005,11]]，“时间“：”2005-11-01T00:00:00Z“，“timestamp”：1130803200000}，“content-version”：“tdm”，“delay-in-days”：0，“URL”：“http://www.springer.com/tdm”}]，“content-domain”：{“domain”（域）：[]，“crossmark-restriction”（交叉标记限制）：false}，”short-container-title“：[”Auton-Agent Multi-Agent系统“]，”published-print“：{”date-parts“：[[2005,11]}”，“DOI”：“10.1007\/s10458-005-2631-2“，”type“：”journal-article“，”created“：{“date-parts”：[[2005,8,31]]，“date-time”：“2005-08-31T12:20:35Z”，“timestamp”：1125490835000}，“page”：“387-434”，“source”：”Crossref“，“is-referenced-by-count”：728，“title”：[“合作多智能体学习：最新技术”]，“prefix”：“10.1007”，“volume”：：“11”，“author”：[{“given”:“Liviu”，“family”：“Panait”，“sequence”：“first”“，”从属“：[]}，{”给定“：“Sean”，“family”：“Luke”，“sequence”：“additional”，“affiliation”：[]}]，“member”：“297”，“reference”：[｛“key”：“2631_CR1”，“doi asserted by”：“crossref”，“unstructured”：“D.H.Ackley and M。利特曼，《通信进化中的利他主义》，《人工生命IV：生命系统合成与模拟国际研讨会论文集》（第3版），麻省理工学院出版社，1994年。“，“DOI”：“10.7551\/mitpress\/1428.003.0008”}，{“key”：“2631_CR2”，“unstructured”：“D.Andre，F.Bennett III，and J。Koza，通过遗传编程发现细胞自动机规则，该规则优于大多数分类问题的任何已知规则，载于《1996年遗传编程：第一届年会论文集》，麻省理工学院出版社，1996年。“}，{“key”：“2631_CR3”，“doi-asserted-by”：“crossref”，“unstructured”：“D.Andre和a。Teller，\u201c进化团队Darwin United，\u201d in M.Asada and H.Kitano，（编辑），RoboCup-98:Robot Soccer World Cup II，Springer Verlag，1999.“，”DOI“：”10.1007\/3-540-48422-1_28“｝，｛“key”：”2631_CR4“，”nonstructured“：”P.Angeline and J.Pollack，\u201c竞争环境为复杂任务提供更好的解决方案，\u201d in S.Forrest，（编辑）《第五届遗传算法国际会议论文集》，Morgan Kaufmann:San Mateo，CA，第264\u2013270页，1993年。B\u00e4ck，《理论与实践中的进化算法：进化策略、进化规划和遗传算法》，牛津出版社，1996年。Balch，《学习角色：机器人团队中的行为多样性》，技术报告GIT-CC-97-12，佐治亚理工学院，1997年。Balch，\u201cReward and diversity in multi-robot forgaging，\u202d in IJCAI-99 Workshop on Agents Learning About，From and With other Agents，1999.“}，{“key”：“2631_CR10”，“unstructured”：“B.Banerjee，R.Mukherjee和S。参议员\u201cLearning mutual trust，《AGENTS-00 Agent Societies中的欺骗、欺诈和信任研讨会工作笔记》，第9页\u201314，2000年。“}，{“key”：“2631_CR11”，“unstructured”：“A.Barto，R.Sutton，and C.Watkins，《Learning and sequential decision making》，M.Gabriel and J.Moore，（编辑）《学习与计算神经科学：自适应网络基础》，麻省理工学院出版社：马萨诸塞州剑桥，1990年，《第十二届智能系统方法学国际研讨会论文集》，Springer-Verlag:Charlotte，NC，第157\u2013165页，2000年。“，“DOI”：“10.1007\/3-540-39963-1_17”}，{“key”：“2631_CR13”，“volume-title”：“进化规则学习中的泛化技术研究”，“author”：“J.K.Bassett”，“year”：“2002”}2631_CR14“，”doi-asserted-by“：”crossref“，”unstructured“：”R.Beckers，O.E.Holland和J.-L.Deneubourg.“从局部行动到全球任务：Stigmergy和集体机器人，《人工生命IV：生命系统合成与模拟国际研讨会论文集》（第三版），麻省理工学院出版社，1994年。“，”doi“：”10.7551\/mitpress\/1428.003.0022“}，{“key”：“2631_CR15”，“unstructured”：“M.Benda，V.Jagannathan，and R.Dodhiawala，On optimal cooperation of knowledge sources-an experimental research，技术报告BCS-G2010-28，波音先进技术中心，波音计算机服务，1986年。”}，}“key:”2631_CR16“，”doi-asserted-by“：”crossref“，”非结构化“：”H.Berenji和D.Vengerov，“强化学习代理在困难随机问题中合作的优势”，载于2000年IEEE第九届模糊系统国际会议论文集，“DOI”：“10.1109”，“Fuzzy.2000.839146”}，{“key”：“2631_CR17”，“unstructured”：“H.Beren ji和D。Vengerov，《多智能体系统中的学习、合作与协调》，技术报告IIS-00-10，智能推理系统公司，333 W.Maude Avennue，Suite 107，Sunnyvale，CA 94085-43672000。“}，{“key”：“2631_CR18”，“unstructured”：“D.Bernstein，S.Zilberstein，and N。Immerman，《MDP分散控制的复杂性》，载于《UAI-2000：第十六届人工智能不确定性会议论文集》，2000年。Parker，\u201cCo-evolving team capture strategies for differential robots，《人工多智能体学习论文集》中的\u201d。2004年AAAI秋季研讨会论文。技术报告FS-04-022004。“}，{”key“：”2631_CR20“，”doi-asserted-by“：”crossref“，”unstructured“：”E.Bonabeau，M.Dorigo，and G.Theraulaz，Swarm Intelligence:From Natural to Artificial Systems，SFI Studies in the Sciences of Complexity，Oxford University Press，1999.“，”doi“：”10.1093\/oso\/9780195131581.001.0001“}”，{“key”：“2631_CR2 1”，“”非结构化”：“J.C.Bongard，\u201cThe legion system:A new approach to evolution异质性for collective problem solution”，载于R.Poli，W.Banzhaf，W.B.Langdon，J.F.Miller，P.Nordin，and T.C.Fogarty，（eds.），《遗传编程：EuroGP-2000会议录》。第1802卷，爱丁堡，15\u201316 2000。斯普林格·弗拉格。ISBN 3-540-67339-3，第16\u201328页。“}，{“key”：“2631_CR22”，“unstructured”：“C.Boutiler，使用似然估计的多智能体随机域中的学习约定，\u2019人工智能中的不确定性，第106\u2013114页，1996年。Boutilier，《多智能体决策过程中的规划、学习和协调》，载于《第六届理性与知识理论方面会议论文集》（TARK96），第195\u2013210页，1996年。“}，{“key”：“2631_CR24”，“unstructured”：“M。Bowling，广义和多智能体强化学习的收敛问题，《第十七届国际机器学习会议论文集》，Morgan Kaufmann:San Francisco，CA，第89\u2013942000页。“}，{“key”：“2631_CR25”，“unstructured”：“M。Bowling，《存在有限制的代理时的多代理学习》，卡内基梅隆大学计算机科学系博士论文，2003年。“}，{“key”：“2631_CR26”，“unstructured”：“M.Bowling和M。Veloso，《用于多智能体强化学习的随机博弈理论分析》，技术报告CMU-CS-00\u2013165，卡内基梅隆大学计算机科学系，2000年。“}，{“key”：“2631_CR27”，“unstructured”：“M.Bowling and M。Veloso，《随机博弈中的理性与收敛学习》，载于《第十七届国际人工智能联合会议论文集》（IJCAI-01），第1021\u201310262001页。Veloso，具有有限代理的多代理均衡的存在性，技术报告CMU-CS-02-104，卡内基梅隆大学计算机科学系，2002年。“}，{”问题“：”2“，”关键“：”2631_CR29“，”doi-asserted-by“：”crossref“，”首页“：”215“，”doi“：”10.1016\/S0004-3702（02）00121-2“，”卷“：”136“，“作者”：”M.Bowling“，”年份“：”2002“，”日志标题“：”Artif公司。Intell“}，{“key”：“2631_CR30”，“unstructured”：“J.A.Boyan和M.Littman，动态变化网络中的包路由：强化学习方法，”J.D.Cowan，G.Tesauro和J.Alscort，（编辑），《神经信息处理系统的进展》，第6卷，Morgan Kaufmann，第671\u20136781994页非结构化“：”R.Brafman和M.Tennenholtz，《高效学习均衡》，《神经信息处理系统进展》（NIPS-2002），2002年。“}，{“key”：“2631_CR32”，“doi-asserted-by”：“crossref”，“非结构化”：“W.Brauer和G。Wei\u00df，\u201cMulti-machine scheduling-a multi-agent learning approach，《第三届多agent系统国际会议论文集》，第42\u201348页，1998年。“，“DOI”：“10.1109\/ICMAS.1998.699030”}，{“key”：“2631_CR33”，“DOI-asserted-by”：“crossref”，“unstructured”：“P.Braddil，M.Gams，S.Sian，L。Torgo和W.van de Velde，分布式系统和多智能体环境中的学习，Y.Kodratoff（ed.），人工智能课堂讲稿，第482卷，Springer-Verlag，第412_u20134231991页volume-title“：“第五届国际自治代理会议记录”，“author”：“O.Buffet”，“year”：“2001”}，{“key”：“2631_CR35”，“doi-asserted-by”：“crossref”，“unstructured”：“O·Buffet，A.Dutech，and F。Charpillet，\u201c学习权衡可伸缩代理中的基本行为，\u201年D，《第一届国际自治代理和多代理系统联合会议论文集》（AAMAS\u201902），2002年。“，”DOI“：”10.1145\/545056.545111“}，{“key”：“2631_CR36”，“DOI-asserted-by”：“crossref”，“unstructured”：“H.Bui，S.Venkatesh，and D。Kieronska，\u201cA智能体团队之间协调和学习的框架，\u201d在W.Wobcke、M.Pagnuco和C.Zhang（编辑），《智能体和多智能体系统：形式主义、方法论和应用》，《人工智能讲义》中。第1441卷，Springer-Verlag，第164\u2013178页，1998年。}，{“key”：“2631_CR38”，“非结构化”：“L。Bull，《多智能体环境中的进化计算：伙伴》，T.Back（ed.），《第七届国际遗传算法会议论文集》，Morgan Kaufmann，第370\u20133771997页。“}，{“key”：“2631_CR39”，“doi-asserted-by”：“crossref”，“unstructured”：“L。Bull，\u201c多智能体环境中的进化计算：算子，\u201d in D.W.V.W.Porto，N.Saravanan，and A.E.Eiben，（编辑），《第七届进化规划年会论文集》，Springer Verlag，pp.43\u2013521998。“，”DOI“：”10.1007\/BFb0040758“｝，｛“key”：“2631_CR40”，“nonstructured”：“L.Bull and T.C。Fogarty，\u201cEvolving cooperative communicating classifier systems\u201d，载于A.V.Sebald和L.J.Fogel（eds.），《第四届进化编程年会论文集》（EP94），第308\u20133151994页。“}，{”key“：”2631_CR41“，”unstructured“：”L.Bull和O。Holland，《多智能体环境中的进化计算：共社会性》，载于《第七届遗传算法年会论文集》，1997年IEEE传输。进化。计算。“}，{”issue“：”1“，”key“：”2631_CR43“，”doi-asserted-by“：”crossref“，”first-page“：”7“，”doi“：”10.1023\/A:1008855018923“，”volume“：“4”，”author“：”Y.U.Cao“，”year“：”1997“，”journal-title“：”Auton.Robots“}”，{“key”：“2631_CR144”，”unstructured“：”D。Carmel，多智能体系统中基于模型的交互策略学习，博士论文，Technion-以色列理工学院，1997年。Markovitch，《M*算法：将对手模型纳入对手搜索》。技术报告9402，Technion-以色列理工学院，1994年3月“}，{“key”：“2631_CR46”，“doi-asserted-by”：“crossref”，“unstructured”：“L.-E.Cederman，《世界政治中的新兴行动者：国家和国家的发展与消解》，普林斯顿大学出版社，1997年”，“doi”：“10.1515\/9780691218038”}，“key“：”2631_CR 47“doi-sserted-by“：”crossref”，“非结构化”：“G.Chalkiadakis和C.Boutiler，《多智能体强化学习中的协调：贝叶斯方法》，载于《第二届自主智能体与多智能体系统国际联合会议论文集》（AAMAS 2003）。ACM，2003年。ISBN 1-58113-683-8“，“DOI”：“10.1145\/860575.860689”}，{“key”：“2631_CR48”，“DOI-asserted-by”：“crossref”，“unstructured”：“H.Chalupsky，Y.Gil，C.A.Knoblock，K.Lerman，J.Oh，D.Pynadath，T.Russ，and M.Tambe，“u201cElectric elves:Agent technology for supporting human organizations”，载于AI Magazine-Summer 2002，AAAI Press，2002”，“DOI:”10.21236\/ADA459956“}，{“key”：“2631_CR49”，“unstructured”：“Y.-H.Chang，T.Ho，and L.Kaelbling，\u201cAll learning is local:Multi-agent learning in global reward games，\u201 d in Proceedings of Neural Information Processing Systems（NIPS-03），2003”}，}“key:”2631_CRV50“unstrustured”，“Y.-H.Chang，T.Ho和L。Kaelbling，移动自组织网络中的多智能体学习，人工多智能体研究论文集，2004年AAAI秋季研讨会论文，技术报告FS-04-022004“}，{“关键”：“2631_CR51”，“非结构化”：“C.Claus和C。Boutiler，《协作多智能体系统中强化学习的动力学》，载于《全国人工智能会议论文集》，第746\u2013752页，1998年“}，{“key”：“2631_CR52”，“doi-asserted-by”：“crossref”，“unstructured”：“D.Cliff和G.F。Miller，\u201cTracking the red queen:Measurements of adaptive progress in co-evolutionary simulations，第三届欧洲人工生命会议论文集，Springer-Verlag，pp.200\u20132181995“，“DOI”：“10.1007\/3-540-59496-5_300”}，{“key”：“2631_CR53”，“DOI-asserted-by”：“crossref”，“first page”：10.1007 \/BFb0029761“，”volume-title“：”Parallel Problem Solving from Nature:1st Workshop（PPSN I）“，”author“：”R.Collins“，”year“：”1991“}，{“key”：“2631_CR54”，”first page“：”579“，”volume-title:“Artificial Life II”，”auth:“R.Collints”，“year”：“1992”}，”{“key”：”2631_CRV5“，”unstructured“：”E.Crawford and M。Veloso，《多智能体会议调度中的学习机会》，载于《人工多智能体学习论文集》，2004年AAAI秋季研讨会论文。技术报告FS-04-022004年“}，{“key”：“2631_CR56”，“unstructured”：“V.Crespi，G.Cybenko，M.Santini，and D.Rus.多智能体系统协调流的分散控制。技术报告TR2002-414，达特茅斯学院，计算机科学，汉诺威，新罕布什尔州，2002年1月”}，}“key”：。Crities，《使用强化学习代理团队进行大规模动态优化》，马萨诸塞大学阿默斯特分校博士论文，1996年“}，{”key“：”2631_CR58“，”first page“：“46”，“volume-title”：“Agents中的读数”，“author”：“M.R.Cutkosky”，“year”：“1997”}，“key”：“2631_CRV9”，“doi-asserted-by”：“crossref”，“unstructured”：“T.Dahl，M.Mataric，and G。Sukhatme，机器人群中的自适应时空组织，2002年IEEE RSJ智能机器人和系统国际会议（IROS-02）论文集，2002年，“DOI”：“10.1109”，IRDS.2002.1041529“}，{“key”：“2631_CR60”，“DOI-asserted-by”：“crossref”，“unstructured”：“R.Das，M.Mitchell，and J。Crutchfield，《遗传算法在细胞自动机中发现基于粒子的计算》，摘自Nature III的并行问题解决，LNCS 866，Springer-Verlag，pp.\u2019344\u20133531994“，“DOI”：“10.1007\/3-540-5844-6_278”}，{“key”：“2631_CR61”，“DOI-asserted-by”：“crossref”，“unstructured”：“J.Davis和G。Kendall，\u201c2002年《进化计算大会会议记录》（CEC2002），2002年，“DOI”：“10.1109\/CEC.2002.1004449”}，{“key”：“2631_CR62”，“unstructured”：“B.de Boer，《在主体群体中生成元音系统》，《第四届欧洲人工生命会议论文集》，麻省理工学院出版社，1997年，}，{“key”：“2631_CR63”，“volume-title”：“一类遗传适应性系统的行为分析”，“author”：“K.Jong de”，“year”：“1975”}，}“key:”2631_CR14“，“unstructured”：“K。De Jong，《进化计算：统一方法》，麻省理工学院出版社，2005年“}，{“key”：“2631_CR65”，“doi-asserted-by”：“crossref”，“unstructured”：“K.Decker，E.Durfee，and V.Lesser，\u201cEvaluation research in cooperative distributed problem solving，\u201 d in L.Gasser and M.Huhns，（eds.）《分布式人工智能》第二卷，皮特曼出版社和摩根考夫曼出版社，第487\u2013519页，1989年“，“DOI”：“10.1016\/B978-1-55860-092-8.50023-X”}，{“问题”：“3”，“密钥”：“2631_CR66”，“DOI-asserted-by”：“crossref”，“首页”：“279”，“DOI:”10.1017\/S02698899900301X“，“卷”：“14”，“作者”：“K.Decker”，“年份”：“1999”，“新闻标题”“：”知识工程。Rev.“}，{”key“：”2631_CR67“，”doi-asserted-by“：”crossref“，”unstructured“：”J.L.Deneubourg、S.Goss、N.Franks、A.Sendova-Franks、C.Detrain和L。Chretien，\u201cThe dynamics of collective sorting:Robot-like ants and ant-like robots，《从动物到动物：第一届自适应行为模拟国际会议论文集》，麻省理工学院出版社，pp.\u2019356\u20133631991“，“DOI”：“10.7551\/mitpress\/3115.003.0048”}，{“key”：“2631_CR68”，“unstructured”：“J.Denzinger and M。Fuchs，《追踪游戏变体学习原型情境的实验》，载于《多智能体系统国际会议论文集》（ICMAS-1996），第48\u2013551996页“}，{“key”：“2631_CR69”，“unstructured”：“M.Dowell.在多智能体系统中学习，博士论文，南卡罗来纳大学，1995年”}2631_CR70“，”doi-asserted-by“：”crossref“，”unstructured“：”K.Dresner和P.Stone，\u201cMultiagent交通管理：基于预留的交叉口控制机制，《AAMAS-2004年第三届国际自治代理和多代理系统联合会议论文集》，2004年，“doi”：“10.1145”，{“key”：“2631_CR71“，”doi-asserted-by“：”crossref“，”unstructured“：”G.Dudek，M.Jenkin，R.Milios，and D.Wilkes，\u201cA分类群机器人，《IEEE\/RSJ智能机器人与系统会议论文集》，1993年，“doi”：“10.1109\/IROS.1993.583135”}，{“key”：“2631_CRV72”，“unstructure”：“E。Durfee，\u201c你的计算机真正需要知道的是什么，你在幼儿园学到的，在全国人工智能会议上学到的，第858页\u2013864页，1992年“}，{“问题”：“11”，“键”：“2631_CR73”，“doi-asserted-by”：“crossref”，“首页”：“1275”，“doi”：“10.1109”，TC.1987.5009468，“卷”：“C-36”，“作者”：“E.Durfee”，“年份”：“1987”，“日志标题”：“IEEE传输。计算“}，{”问题“：”1“，”键“：”2631_CR74“，”doi-asserted-by“：”crossref“，”首页“：”63“，”doi“：”10.1109\/69.43404“，”卷“：”KDE-1“，“作者”：”E.Durfee“，”年份“：”1989年3月“，”期刊标题“：”IEEE Trans.Knowl.Data Eng.“}”，{“键”：“2631_CR175”，“非结构化”：“A.Dutech，O.Buffet，and F。Charpillet，\u201cMulti-agent systems by incremental gradient reinforcement learning，《第十七届国际人工智能联合会议论文集》（IJCAI-01），第833\u2013838页，2001年“}，{“issue”：“4”，“key”：“2631_CR76”，“first page”：。机器人。自动。“}，{”key“：”2631_CR77“，”first-page“：”238“，”volume-title“：”Proceedings of the Sixth International Conference on Artificial Life“，”author“：”S.Ficici“，”year“：”1998“}”，{“key”：“2631_CR 78”，”doi-asserted-by“：”crossref“。Pollack，《简单协同进化算法的游戏理论方法》，载于《第六届自然并行问题解决国际会议论文集》（PPSN VI）。Springer Verlag，2000“，“DOI”：“10.1007\/3-540-45356-3_46”}，{“key”：“2631_CR79”，“DOI-asserted-by”：“crossref”，“unstructured”：“K.Fischer，N.Kuhn，H.J.Muller，J.P.Muller，and M。Pischel，\u201cSopisticated and distributed:The transport domain，\u201d in Proceedings of The Fifth European Workshop on Modeling Autonomous Agents in a Multi-Agent World（MAAMAW\u201993），1993”，“DOI”：“10.1109\/CAIA.1993.366629”｝，｛“key”：“2631_CR80”，“nonstructured”：“D。Fogel，《金发女郎24：在人工智能的边缘玩耍》，摩根·考夫曼，2001年。ISBN 1-55860-783-8“}，{“key”：“2631_CR81”，“unstructured”：“L.Fogel，Intelligence Through Simulated Evolution:Forty Years of Evolutionary Programming，Wiley Series on Intelligent Systems，1999”}，“key（钥匙）：“2631.CR82”，“非结构化”：“D.Fudenberg and D.Levine，The Theory of Learning in Games，MIT Press，1998”}、{“钥匙”：“6313_CR83”，“doi-asserted-by”：“crossref”，“首页”：“267”，“DOI”：“10.1023\/B:AGNT.0000018808.95119.9e”，“卷”：“8”，“作者”：“A.Garland”，“年份”：“2004”，“期刊标题”：“Auton。Agent多Agent系统。“｝，｛”key“：”2631_CR84“，”非结构化“：”M.Ghavamzadeh和S.Mahadevan，\u201c学习使用分层强化学习进行沟通和行动，\u201d in AAMAS-2004-第三届自主代理和多代理系统国际联席会议记录，2004“｝，｛”issue“：”3“，”key“：”2631_CR85“，”doi asserted by“：”crossref“，”首页“：”76“，”DOI“：”10.1038\/scienceficamerican0394-76“，”卷“：”270“，”作者“：”N.Glance“，”年份“：”1994“，”期刊标题“：”科学。Am.“}，{“key”：“2631_CR86”，“unstructured”：“P.Gmytrasiewicz，自治系统中协调和通信的决策理论模型（推理系统），博士论文，密歇根大学，1992年”}，“key“：”2631_CRH7“，“volume-title”：“搜索、优化和机器学习中的遗传算法”，“author”：“D.E.Goldberg”，“year”：“1989”}key“：”2631_CR88“，”doi-asserted-by“：”crossref“，”first-page“：”85“，”doi“：”10.1007\/3-540-60923-7_20“，”volume-title“：”Multi-Agent系统中的适应和学习“，”author“：”C.Goldman“，”year“：”1996“}，{“key”：“2631_CRH9”，”unstructured“：”B.M。好的，发展中的多智能体系统：比较现有方法并建议新方向，硕士论文，苏塞克斯大学，2000年“}，{“key”：“2631_CR90”，“unstructured”：“M.Gordin，S.Sen，and N。Puppala，\u201cEvolving cooperative groups:初步结果\u201d，载于《AAAI-97多智能体学习研讨会工作文件》，第31页\u201335，1997年“}，{“问题”：“1”，“关键”：“2631_CR91”，“doi-asserted-by”：“crossref”，“第一页”：“39”，“doi”：“10.1023”，“A:10104252104”，“卷”：“一”，“作者”：“S.Grand”，“年份”：“1998”，“新闻标题”：“自动。Agent多Agent系统。“}，{”key“：”2631_CR92“，”doi-asserted-by“：”crossref“，”unstructured“：”S.Grand，D.Cliff，and A.Malhotra，\u201cCreatures:Artificial life autonomous software agents for home entertainment“，收录于《第一届国际自治代理会议论文集》（agents-97），第22\u2013291997页“，”doi“：”10.1145\/267658.267663“}”，{“key”：”2631_CR93“，“非结构化”：”D.L.Grecu，《使用学习改进设计多代理系统》。伍斯特理工学院博士论文，1997年“}，{“key”：“2631_CR94”，“unstructured”：“A.Greenwald、J.Farago和K.Hall，圣达菲酒吧问题的公平和有效解决方案，2019年《Grace Hopper Computing女性庆祝会论文集》，2002年”}，}，“key“：”2631_CRR95“，“unsructured“：”A.Greenwald和K。Hall，\u201cCorrelated Q-learning，\u201第二十届国际机器学习会议论文集，2003年“}，{”key“：”2631_CR96“，”first page“：“303”，“volume-title”：“the Proceedings of the Fourth International Conference on Genetic Algorithms”，“author”：“J.Grefenstette”，“year”：“1991”}，“key”：“2631_CRR97”，“first pages”：“355”，“作者：“J.Grefenstette”，“年份”：“1990年”，“新闻标题”：“机器学习”。“}，{”key“：”2631_CR98“，”unstructured“：”C.Guestrin，M.Lagoudakis，and R.Parr，\u201cCoordinated reinforcement learning，\u201《2002年AAAI研讨会系列论文集：协作学习代理》，2002年“}”，{“key”：“2631-CR99”，“volume-title”：“协作机器人足球问题的遗传编程分层学习”，“author”：“S.M.”。Gustafson“，”year“：”2000“}，{“key”：“2631_CR100”，”doi-asserted-by“：”crossref“，”first page“：”291“，”doi“：”10.1007 \/3-540-45355-5_23“，”volume-title“：”Genetic Programming:Proceedings of EuroGP-2001“，“author”：“S.M.Gustafsen”，“year”：“2001”}，”{“key”：”2631_CR101“，”unstructured“：”A.Hara和T.Nagao，\u201cADE合作行为的出现G；自动定义群体，《1999年遗传和进化计算会议论文集》（GECCO-99），第1038\u20131046页，1999年“}，{“key”：“2631_CR102”，“unstructured”：“I.Harvey，P.Husbands，D.Cliff，A.Thompson，and N.Jakobi，\u201cEvolutionary robots:the Sussex approach，\u 201d Robot.Auton.Syst.，1996”}，}“key:”2631_CR103“，“非结构化”：”T.Haynes、K.Lau和S.Sen，《学习案例以补充多智能体系统中冲突解决规则》，S.Sen.（ed.），AAAI多智能体自适应、协同进化和学习春季研讨会，第51\u2013561996页“}，{“key”：“2631_CR104”，“volume-title”：“多智能体系统中的适应和学习，人工智能课堂讲稿”，“作者”：“Haynes T.”，“年份”：“1995”}，{“关键”：“2631_CR105”，“非结构化”：“T.Haynes和S.Sen，合作组中的适应使用案例，I.Imam（编辑）中的u201d，AAAI-96智能自适应代理研讨会工作笔记，俄勒冈州波特兰，1996”}，{“key”：“2631_CR106”，“unstructured”：“T.Haynes和S.Sen，适者合作，技术报告UTULSA-MCS-96-09，塔尔萨大学，1996年4月12日”}，{”key“：”2631_CR107“，”unstructure“：”T.Hayes和S.Sen，\u201cLearning cases to resolution conflicts and improved group behavior，\u2018年，M.Tambe和P.Gmytrasiewicz，（eds.）《AAAI-96 Agent建模研讨会工作笔记》，俄勒冈州波特兰，第46\u201352页，1996年“}，{“key”：“2631_CR108”，“unstructured”：“T.Haynes和S.Sen，演化团队的跨线操作符，J.R.Koza，K.Deb，M.Dorigo，D.B.Fogel，M.Garzon，H.Iba，和R.L.Riolo，（编辑）《基因编程1997：第二届年会论文集》，摩根·考夫曼：美国加利福尼亚州斯坦福大学，第162\u2013167页，第13\u201316页，1997年7月“}，{“key”：“2631_CR109”，“unstructured”：“T.Haynes，S.Sen，D.Schoenefeld，and R.Wainwright，《Evolving a team》，E.V.Siegel and J.R.Koza（eds.）《AAAI遗传编程研讨会工作说明》，AAAI:MIT，Cambridge，MA，USA，第23\u201330页，第10\u201312页，1995年11月“}，{“key”：“2631_CR110”，“unstructured”：“T.Haynes，S.Sen，D.Schoenefeld，and R。Wainwright，用遗传编程进化多智能体协调策略，技术报告UTULSA-MCS-95\u201304，塔尔萨大学，1995年5月31日“}，{“key”：“2631_CR111”，“unstructured”：“T.Haynes，R.Wainwrit，S.Sen，and D.Schoenefeld，进化合作策略中的强类型遗传编程，L。Eshelman（编辑），《遗传算法：第六届国际会议论文集》（ICGA95），Morgan Kaufmann:Pittsburgh，PA，USA，第271\u2013278页，ISBN 1-55860-370-01995年7月15日至19日“}，{“key”：“2631_CR112”，“unstructured”：“T.D.Haynes和S.Sen，\u201cCo-adaptation in a team，\u2018 Int.J.Compute.Intell.Org.（IJCIO），1997”}，}“key:”2631_CR113“，”首页“：”313“，”卷“：”10“，”作者“：”D.Hillis“，”年份“：”1991“，”期刊标题“：”Artif。生命II，SFI科学研究。复杂。“}，{“key”：“2631_CR114”，“volume-title”：“在自然和人工系统中的适应”，“author”：“J.Holland”，“year”：“1975”}，“{”key“：”2631_CR115“，“unstructured”：“J Holland，\u201cProperties of the bucket Bridge，\u 201d in Proceedings of an International Conference on Genetic Algorithms，1985”}非结构化”：“B.H\u00f6lldobler和E.O.Wilson，《蚂蚁》，哈佛大学出版社，1990年”，“DOI”：“10.1007\/978-3662-10306-7”}，{“key”：“2631_CR117”，“unstructured”：“W.H.Hsu和S.M.Gustafson，《遗传编程和多智能体分层强化学习》，W.B.Langdon，E.Cant\u00fa-Paz，K.Mathias，R.Roy，D.Davis，R。Poli，K.\u2019Balakrishnan，V.Honavar，G.Rudolph，J.Wegener，L.Bull，M.Potter，A.C.Schultz，J.F.Miller，E.Burke，and N.Jonoska，（编辑），GECCO 2002:《遗传与进化计算会议论文集》，Morgan Kaufmann出版社：纽约，2002年7月9日至13日，ISBN 1-55860-878-8，第764-771页“}，{“关键”：“2631_CR118”，“非结构化”：“J.Hu和M.Wellman，多智能体学习中的自我实现偏差，《第二届多智能体系统国际会议论文集》，1996年”}，{“关键”：“2631_CR119”，“非结构化”。Wellman，《多智能体强化学习：理论框架和算法》，载于《第十五届国际机器学习会议论文集》，Morgan Kaufmann:San Francisco，CA，pp.242\u20132501998“}，{“key”：“2631_CR120”，“doi-asserted-by”：“crossref”，“unstructured”：“J.Hu和M。Wellman，\u201cOnline learning about other agents in a dynamic multiagent system，K.\u2019P中的\u201d。Sycara和M.Wooldridge，（编辑），《第二届自治代理国际会议论文集》（Agents\u201998），ACM出版社：纽约，1998年，第239\u2013246页，ISBN 0-89791-983-1，“DOI”：“10.1145\/280765.280839”}，{“key”：“2631_CR121”，“首页”：“1039”，“volume”：”4“author”：“J.Hu”，“year”：“2003”，“journal title”：“J Machine Learn.Res.”}、{key“：”2631_CR122“，”doi-asserted-by“：”crossref“，”first-page“：”219“，”doi“：”10.1007\/3-540-58855-8_14“，”volume-title“：”Intelligent Agents:Theorys，Architectures，and Languages（LNAI volume 890）“，”author“：”J.Huang“，“year”：“1995”}，{“key”：“2631_CR123”，“unstructured”：“M.Huhns and M。Singh，\u201C代理和多代理系统：主题、方法和挑战，\u2019M中的\u201d。Huhns和M.Singh，（编辑），《代理阅读》，Morgan Kaufmann，pp.1\u2013231998“}，{“key”：“2631_CR124”，“doi-asserted-by”：“crossref”，“unstructured”：“M.Huhns and G.Wei\u00df，《多代理学习特刊》，《201d Machine Learn.J.》，第33卷，nos.2\u201331998年”，“doi”：“10.1023\/A:1007547205842”}，}，“key“2631/CR125”，“非结构化”“：”H。Iba，\u201cEmergent cooperation for multiple agents using genetic programming，\u202d in H.-M.Voigt，W.Ebeling，I.Rechenberg，and H.-P.Schwefel，（eds.），《自然中的并行问题解决：进化计算国际会议论文集》，LNCS第1141卷，施普林格出版社：德国柏林，1996年，第32页\u201341，ISBN 3-540-61723-X“｝，｛“key”：“2631_CR126”，“doi asserted by”：“crossref”，“nonstructured”：“H.Iba，\u201c通信代理的进化学习，\u201d Inform.Sci.，vol.1081998”，“doi”：“10.1016/S0020-0255（97）10055-X”｝，｛“key”：“2631_CR127”，“首页”：“447”，“卷标题”：“遗传编程进展3”，“作者”：“H.Iba”，“年份”：“1999”｝，｛key“：”2631_CR128“，”unstructured“：”I.Imam（编辑），《智能自适应代理》。1996年AAAI研讨会的论文。技术报告WS-96-04，AAAI出版社，1996年“}，{“key”：“2631_CR129”，“unstructured”：“A.Ito，\u201c自私的代理如何学会合作？”，《人工生命V：第五届生命系统合成与模拟国际研讨会论文集》，麻省理工学院出版社，第185\u2013192页，1997年”}，}crossref”，“非结构化”：“T.Jansen和R.P.Wiegand，\u201cExploring the exploration the explorerative advance of the cooperative co-Evolutionary（1+1）EA，\u201 d in E.Cantu-Paz et al.，（ed.），《遗传与进化计算会议（GECCO）的进展》，Springer-Verlag，2003年”，“DOI”：“10.1007\/3-540-45105-6_37”}，{“key”：“2631_CR131”，“doi-asserted-by“：”crossref“，”first-page“：”7“，”doi“：”10.1023\/A:101090405266“，”volume“：”1“，”author“：”N.Jennings“，”year“：”1998“，”journal-title“：”Auton-Agents Multi-Agents Syst“。“}，{”issue“：”4“，”key“：”2631_CR132“，”doi-asserted-by“：”crossref“，”first-page“：”317“，”doi“：”10.1016\/0952-1976（93）90016-Q“，”volume“：“：”crossref“，”first-page“：”237“，”doi“：”10.1162\/106454600568861“，”volume“：”6“，“作者”：“K.C.吉姆”，“年份”：“2000年”，“新闻标题”：“Artif。Life“}，{“key”：“2631_CR134”，“unstructured”：“H.Juille和J.Pollack，《共同参与细胞自动机训练器：在细胞自动机规则发现中的应用》，第三届年度遗传编程会议（GP-98），1998年”}，}，“key“：”2631_CR135“，”doi-asserted-by“：”crossref“，”first page“：“237”，“doi”：“10.1613 \/jair.301“，”卷“：”4“，”作者“：”L.Kaelbling“，”年份“：”1996“，”新闻标题“：”J.Artif。智力。研究“}，{“key”：“2631_CR136”，“doi-asserted-by”：“crossref”，“unstructured”：“S.Kapetanakis和D.Kudenko，改进协作多智能体系统中协调的强化学习，载于《第二届自适应智能体和多智能体系统研讨会论文集》（AISB02），2002年”，“doi”：“10.1007\/3-540-44826-8_2”}doi-asserted-by“：”crossref“，”unstructured“：”S.Kapetanakis和D.Kudenko，\u201c合作多智能体系统中协调的强化学习\u201d，《第十九届全国人工智能会议论文集》（AAAI02），2002年，“doi”：“10.1007\/3-540-44826-8_2”}，{“key”：“2631_CR138”，“doi-assert-by”：“crossref.”，“非结构化”：“G.Kendall和G.Whitwell，使用人口动力学调整国际象棋评估函数的进化方法，2001年进化计算大会论文集（CEC-2001），IEEE出版社，第995\u20131002、27\u201330、2001页”，“DOI”：“10.1109\/CEC.2001.934299”}，{“key”：“2631_CR139”，“doi-asserted-by“：”crossref“，”unstructured“：”G.Kendall和M.Willdig，\u201cAn investment of a adaptive poker player\u201d，in Proceedings of the 14th Australian Joint Conference on Artificial Intelligence（AI\u201901），2001“，”doi“：”10.1007\/3-540-456-2_17“}，{“key”：“2631_CR140”，“doi-assert-by”：“crossref.”，“unstructure”：“H.Kitano，M。Asada，Y.Kuni\u0177oshi，I.Noda和E.Osawa，《机器人世界杯倡议》，W.L.Johnson和B.Hayes-Roth（编辑），《第一届国际自治代理会议论文集》（Agents），ACM出版社：纽约，5-8，ISBN 0-89791-877-0，pp.\u2019340-3471997“，“DOI”：“10.1145\/267658.267738”}，{“key”：“2631_CR141“，“非结构化”：“J.Koza，《遗传编程：通过自然选择实现计算机编程》，麻省理工学院出版社，1992年”}，{“键”：“2631_CR142”，“非结构”：“M.Lauer和M。Riedmiller，合作多智能体系统中分布式强化学习的算法，第十七届国际机器学习会议论文集，Morgan Kaufmann:San Francisco，CA，pp.535\u20135422000“}，{“key”：“2631_CR143”，“unstructured”：“L.R.Leerink，S.R.Schultz，and M.A。Jabri，基于蚂蚁觅食机制的强化学习探索策略，《第六届澳大利亚神经网络会议论文集》，澳大利亚悉尼，1995年，}，{“问题”：“1”，“关键”：“2631_CR144”，“doi-asserted-by”：“crossref”，“第一页”：“133”，”doi“：“10.1109\/69.755622”，“卷”：“11”，“作者”：“V.Lesser”，“年份”：“1999年”，“期刊标题”：“IEEE Trans。知识。Data Eng.“}，{”key“：”2631_CR145“，”unstructured“：”V.Lesser，D.Corkill，and E.Durfee，《分布式车辆监测试验台的更新》，技术报告UM-CS-1987-111，马萨诸塞大学阿姆赫斯特分校，1987年“}”，{“key”：“2631_CR146”，“doi-asserted-by”：“crossref”，”非结构化“：”M.I。利奇巴赫，《合作者的困境》，密歇根大学出版社，1996年。ISBN 0472105728“，“DOI”：“10.3998\/mpub.13808”}，{“key”：“2631_CR147”，“DOI-asserted-by”：“crossref”，“unstructured”：“M.Littman，作为多智能体强化学习框架的201cMarkov博弈”，《第十一届国际机器学习会议论文集》（ML-94），Morgan Kaufmann:New Brunswick，NJ，pp.157\u20131631994”DOI“：”10.1016\/B978-1-55860-335-6.50027-1“}，{“key”：“2631_CR148”，“unstructured”：“M.Littman，\u201cFriend-or-foe Q-learning in general-sum games，\u201 d in Proceedings of the十八届国际机器学习会议论文集，Morgan Kaufmann，pp.322\u20133282001”}，“key“：”2631_CR149“非结构化”：“A.Lubberts and R。Miikkulainen，\u201cCo-evolving a go-playing neural network，《协同进化：将自适应算法转向自己》，（鸟类羽毛研讨会，遗传与进化计算会议），2001年“}，{“问题”：“3”，“关键”：“2631_CR150”，“doi-asserted-by”：“crossref”，“首页”：“297”，“doi”：“10.1017\/S026988898003014”，“卷”：“13”作者：“M.Luck”，“年份”：“1998年”，“新闻标题”：“Knowl。Eng.Rev.“}，{“key”：“2631_CR151”，“unstructured”：“S.Luke，\u201cGenetic programming为RoboCup97、\u201d制作了具有竞争力的足球软机器人团队，J.R.Koza et al，（ed.），《Genetic programming 1998：第三届年会论文集》，Morgan Kaufmann，pp.214\u20132221998”}，“{”key：“26316_CR152”，“doi-asserted-by”：“crossref”，“”非结构化“：”S.Luke、C.Hohn、J.Farris、G.Jackson和J.Hendler，《共同参与足球软机器人团队与遗传编程的协调》，《机器人杯第一届国际研讨会论文集》，2019年国际人工智能联合会议，日本名古屋，1997年》，“DOI”：“10.1007”-3-540-64473-3_76“}，{”key“：”2631_CR153“，”unstructured“：”S.Luke和L.Spector，《进化团队合作与遗传编程协调》，J.R.Koza、D.E.Goldberg、D.B.Fogel和R.L.Riolo（编辑），《1996年遗传编程：第一届年会论文集》，麻省理工学院出版社：美国加利福尼亚州斯坦福大学，pp.150\u2013156、28-31 1996“}，{“key”：“2631_CR154“，”doi-asserted-by“：”crossref“，”unstructured“：”S.Luke，K.Sullivan，G.C.Balan和L.Panait，合作目标观测的可调分散算法，技术报告GMU-CS-TR-2004-1，乔治梅森大学计算机科学系，2004年“，”doi“：”10.1145\/1082473.1082611“}，{“key”：“2631_CR155”，“unstructure”：“S。Luke和R.P.Wiegand，《保证共同进化目标测度》，Poli等人[201]，第237\u2013251页“}，{“关键”：“2631_CR156”，“非结构化”：“S.Mahadevan和J。Connell，使用强化学习对基于行为的机器人进行自动编程，《全国人工智能会议》，第768页，第2013773页，1991年“}，{“key”：“2631_CR157”，“doi-asserted-by”：“crossref”，“first-page”：“246”，“doi”：“10.1145\/375735.376302”，“volume-title”：“第五届国际自治代理会议记录”，“作者”：“R.Makar”，“年份”：“2001”}，{“key”：“2631_CR158”，“doi-asserted-by”：“crossref”，“volume-title”：“交互与智能行为”，“author”：“M.Mataric”，“year”：“1994”，“doi”：“10.21236\/ADA290049”}。Mataric，《学会社交行为》，第三届自适应行为模拟国际会议，1994年，“DOI”：“10.7551\/mitpress\/3117.003.0065”}，{“key”：“2631_CR160”，“DOI-asserted-by”：“crossref”，“unstructured”：“M。Mataric，\u201cReward functions for accelerated learning，国际机器学习会议，第181\u20131891994页，“DOI”：“10.1016\/B978-1-55860-335-6.50030-1”}，{“key”：“2631_CR161”，“DOI-asserted-by”：“crossref”，“unstructured”：“M。Mataric，\u201c多机器人领域的强化学习，\u201d Auton。机器人，第4卷，第1期，pp.\u201973\u2013831997“，“DOI”：“10.1007\/9781-4757-6451-2_4”}，{“key”：“2631_CR162”，“unstructured”：“M。Mataric，《使用通信减少分布式多智能体学习中的局部性》，《学习自动化联合专刊》。《机器人》，《机器学习》，第31卷，第1-3期，第141\u2013167页，以及《汽车》。机器人，第5卷，第3-4期，第335\u2013354页，1998年7月\/8月“}，{“key”：“2631_CR163”，“doi-asserted-by”：“crossref”，“unstructured”：“M.Mataric，M.Nilsson，and K.Simsarian，“u201cCooperative multi-robot-pushing”，《IEEE智能机器人与系统会议论文集》，第556\u2013561页，1995年”，“doi”：“10.1109\/IROS.1995.525940”}，｛“key”：“2631_CR164”，“doi asserted by”：“crossref”，“nonstructured”：“Z.Michalewicz，遗传算法+数据结构=进化程序（第三版），Springer Verlag:Berlin，1996”，“doi”：“10.1007\/978-3-662-03315-9”｝，｛“key”：“2631_CR165”，“nonstructured”：“T.Miconi，\u201cA集体遗传算法\u201d，见E.Cantu-Paz等人（编辑）《遗传与进化计算会议论文集》，第876\u20138832001页“}，{“key”：“2631_CR166”，“unstructured”：“T。Miconi，《进化中的种群比共同进化的个体更好：盲鼠问题》，载于《第十八届国际人工智能联合会议论文集》（IJCAI-03），2003年“}，{“关键”：“2631_CR167”，“非结构化”：“M.Mitchell，J.Crutchfield，and R。Das，\u201cEvolving cellular automata with genetic algorithms:A \u2019review of recenter works，\u 201d in Proceedings of the First International Conference on Evolutionary Computation and its Applications（EvCA\u201996），1996“}，{“key”：“2631_CR168”，“doi-asserted-by”：“crossref”，“unstructured”：“N.Monekosso，P.Remagnio，and A。Szarowicz，《使用合成信息素的改进Q-学习算法》，载于E.N.B.Dunin-Keplicz（编辑），《从多智能体系统的理论到实践》，中欧和东欧多智能体体系第二次国际研讨会，CEEMAS 2001，波兰克拉科夫，2013年9月26日，2001年。修订论文，人工智能LNAI-2296课堂讲稿，Springer-Verlag，2002年”，“DOI”：“10.1007\/3-540-45941-3_21”}，{“key”：“2631_CR169”，“DOI-asserted-by”：“crossref”，“unstructured”：“N.D.Monekosso and P。Remagnino，\u201cPhe-Q:基于信息素的Q-learning，《澳大利亚人工智能联合会议》，第345\u20133552001页，“DOI”：“10.1007\/3-540-45656-2_30”}，{“key”：“2631_CR170”，“DOI-asserted-by”：“crossref”，“unstructured”：“N.D.Monekosso and P。Remagnino，《信息素Q学习算法的分析》，载于《第八届伊比利亚-美洲人工智能会议论文集》，IBERAMIA-02，第224\u20132322002页，“DOI”：“10.1007\/3-540-36131-6_23”}，{“key”：“2631_CR171”，“DOI-asserted-by”：“crossref”，“unstructured”：“N.D.Monekosso，P.Remagnio，and A。Szarowicz，\u201c使用合成信息素的改进Q-学习算法，《中欧和东欧多智能体系统第二次研讨会论文集》CEEMAS-01，第197\u2013206页，2001年“，“DOI”：“10.1007\/3-540-45941-3_21”}，{“key”：“2631_CR172”，“unstructured”：“J.Moody，Y.Liu，M.Saffell，and K。Youn，\u201c《随机直接强化：应用于具有重复性的简单游戏》，载于《人工多智能体学习论文集》，2004年AAAI秋季研讨会论文。技术报告FS-04-02，2004年“}，{“key”：“2631_CR173”，“unstructured”：“R.Mukherjee和S.Sen，\u201cTowards a pareto-optimal solution in general-sum games，\U 201d in Agents-2001 Workshop on Learning Agents，2001”}，“key“：”2631_CR174“，“doi-asserted-by”：“crossref”，“非结构化”：“U.Mukhopadjyay，L.Stephens，and M。Huhns，\u201cAn intelligent system for document retrieval in distributed office environment，美国社会科学杂志。，第37卷，1986年“，“DOI”：“10.1002（SICI）1097-4571（198605）37:3<123:：AID-ASI3>3.0.CO；2-3“}，{“问题”：“1”，“key”：“2631_CR175”，“doi-asserted-by”：“crossref”，“首页”：“25”，“doi”：“10.1142\/S021821579400003X”，“卷”：“3”，“作者”：“J.Muller”，“年份”：“1994”，“日志标题”：“J Intell.Coop.Inform.Syst.”}M.Mundhe和S。Sen，\u201c评估并发强化学习者，《多智能体系统国际会议论文集》，2000年，“DOI”：“10.1109”：“ICMAS.2000.858505”}，{“关键”：“2631_CR177”，“非结构化”：“M.Mundhe和S.Sen，《避免社会困境的进化智能体社会》，D.Whitley，D.\u2019Goldberg，E.Cantu-Paz，L。Spector，I.Parmee和H.-G.Beyer，（编辑），《遗传与进化计算会议论文集》（GECCO-2000），Morgan Kaufmann:美国内华达州拉斯维加斯，2000年10月12日，第809\u2013816页，ISBN 1-55860-708-0“}，{“key”：“2631_CR178”，“doi-asserted-by”：“crossref”，“unstructured”：“Y.Nagayuki，S.Ishii，and K。Doya，《多智能体强化学习：一种基于其他智能体内部模型的方法》，载于《国际多智能体系统会议论文集》（ICMAS-00），2000年，“DOI”：“10.1109”，ICMAS.2000.858456“}，{“key”：“2631_CR179”，“unstructured”：“M.V。Nagendra-Prisad，《多智能体系统中的学习情境特定控制》，马萨诸塞大学阿默斯特分校博士论文，1997年“}，{“key”：“2631_CR180”，“unstructured”：“R.Nair，D.Pynadath，M.Yokoo，M.Tambe，and S。Marsella，\u201cTaming decentralized POMDPs:Towards efficient policy computation for multi-agent settings，《第十八届国际人工智能联合会议论文集》（IJCAI-03），2003年“}，{“key”：“2631_CR181”，“doi-asserted-by”：“crossref”，“first page”：《573》，“doi”：“10.1038\/31225”，“volumes”：“393”，“author”：“M。Nowak”，“年份”：“1998年”，“新闻标题”：“自然”}，{“key”：“2631_CR182”，“非结构化”：“A.Nowe，K.Verbeeck，and T.Lenaerts，人类规范社会中的学习代理，技术报告，计算建模实验室-VUB，2001年3月”}。Oliveira，《从多个来源学习》，《AAMAS-2004第三届国际自治代理和多代理系统联合会议论文集》，2004年，{“key”：“2631_CR184”，“doi-asserted-by”：“crossref”，“unstructured”：“T.Ohko，K.Hiraki，and Y。Arzai，\u201cAddressee learning and message interception for communication load reduction in multiple robots environments，《分布式人工智能与机器学习：多智能体环境中的学习》，《人工智能1221课堂讲稿》，Springer-Verlag，1997年，“DOI”：“10.1007\/3-540-62934-3_52“}，{“key”：“2631_CR185”，“doi-asserted-by”：“crossref”，“unstructured”：“E.Ostergaard，G.Sukhatme，and M。Mataric，\u201cEmergent bucket brigading-一种改进多机器人受限空间觅食任务性能的简单机制，《第五届自治代理国际会议论文集》，2001年，“DOI”：“10.1145\/375735.375825”}，{“key”：“2631_CR186”，“unstructured”：“L.Pagie and M。Mitchell，《进化搜索与协同进化搜索的比较》，R.K.Belew和H.Juill（编辑），《协同进化：将自适应算法转向自身》，美国加利福尼亚州旧金山，第20\u201325页，2001年7月“}，{“key”：“2631_CR187”，“doi-asserted-by”：“crossref”，“unstructured”：“L.Panait和S。Luke，《Ant foraging reviewed》，载于《第九届生命系统模拟与合成国际会议论文集》（ALIFE9），2004年，“DOI”：“10.7551\/mitpress\/1429.003.0096”}，{“key”：“2631_CR188”，“DOI-asserted-by”：“crossref”，“unstructured”：“L.Panait and S。Luke，《学习蚂蚁觅食行为》，载于《第九届生物系统模拟与合成国际会议论文集》（ALIFE9），2004年，“DOI”：“10.7551\/mitpress\/1429.003.0097”}，{“key”：“2631_CR189”，“unstructured”：“L.Panait and S。Luke，《协作觅食的基于信息素的实用模型》，载于AAMAS-2004——第三届国际自治代理和多代理系统联合会议论文集，2004年“}，{“key”：“2631_CR190”，“doi-asserted-by”：“crossref”，“unstructured”：“L.Panait，R.P.Wiegand，and S。Luke，一种有利于优化的协同进化算法的敏感性分析，《遗传与进化计算会议-GECCO-2004》，Springer，2004年，“DOI”：“10.1007”，978-3-540-24854-5_59“}，{“key”：“2631_CR191”，“DOI-asserted-by”：“crossref”，“unstructured”：“L.Panait，R.P.Wiegand，and S。Luke，合作协同进化收敛特性的可视化演示，《自然并行问题解决》中的u201d-PPSN-2004，Springer，2004年，“DOI”：“10.1007”，978-3-540-30217-9_90“}，{“key”：“2631_CR192”，“unstructured”：“L.A.Panait，R.P.Wiegand，and S。Luke，\u201c改进协同进化搜索最优多智能体行为\u201d，载《第十八届国际人工智能联合会议论文集》（IJCAI-03），2003年“}，{“问题”：“3”，“关键”：“2631_CR193”，“doi-asserted-by”：“crossref”，“第一页”：“441”，“doi”：“10.1287”，“moor.123.441”“卷”：“12”，“作者”：“C.Papadimitriou”年份”：“1987年”，“新闻标题”：“数学”。运营商。Res.“｝，｛“key”：“2631_CR194”，“doi asserted by”：“crossref”，“unstructured”：“L.Parker，\u201c分布式自主移动机器人的最新技术，\u201d in L.Parker，G.\u2019Bekey，and J.Barhen，（eds.），distributed autonomous Robotic Systems 4，Springer Verlag，pp.3\u2013122000”，“doi”：“10.1007\/978-4-431-67919-6_1”｝，｛“key”：“2631_CR195“，”doi-asserted-by“：”crossref“，”unstructured“：”L.Parker，合作观测任务中的Multi-robot学习，《第五届分布式自治机器人系统国际研讨会论文集》（DARS 2000），2000年，“doi”：“10.1007\/978-4431-67919-6_37”}，{“key”：“2631_CR196”，“doi-assert-by”：“crossref.”，“unstructure”：“L.Parker，《多移动目标多机器人观测分布式算法》，《自动机器人》，第12卷，第3期，2002年》，“DOI”：“10.1023\/A:1015256330750”}，{“key”：“2631_CR197”，“unstructured”：“L.Parke，C.Touzet，and F.Fernandez，《多机器人团队学习技术》，T.Balch and L.Park，（eds.），《机器人团队：从多样性到多态性》，AK Peters，2001年，{“关键”：“2631_CR198”，“非结构化”：“M.Peceny，G.Wei\u00df，and W.Brauer，Vertiltes maschinelles lernen in fertigungsumgebungen，技术报告FKI-218-96，Institut fur Informatik，Technische Universitat Munchen，1996”}，{“关键”：“2631_CR199”，“非结构化”：“M.Peeters，K。Verbeeck和A.Nowe，《信息不完全的冲突多层次博弈中的多智能体学习》，载于《人工多智能体教学论文集》，2004年AAAI秋季研讨会论文。《技术报告》FS-04-022004“｝，｛“密钥”：“2631_CR200”，“非结构化”：“L.Peshkin，K.-E.Kim，N.Meuleau和L.Kaelbling，\u201c学习通过政策搜索进行合作，\u201d在第十六届人工智能不确定性会议上，Morgan Kaufmann，2000，pp.307\u2013314”｝，｛“密钥”：“2631_CR201”，“非结构化”：“R.Poli，J.Rowe和K.D。Jong，（eds.），《遗传算法基础》（Foundations of Genetic Algorithms）VII，2002，Morgan Kaufmann“}，{”issue“：”3“，”key“：”2631_CR202“，”doi-asserted-by“：”crossref“，“first page”：“225”，“doi”：“10.1023\/A:1007417214905”，“volume”：”32“，”author“：”J.Pollack“，”year“1998”，“journal-title”：“Machine Learn.”}，}“key”：92“，”卷时间“：”人工生命V：程序。第五届生命系统合成与模拟国际研讨会”，“作者”：“J.Pollack”，“年份”：“1997”}，{“密钥”：“2631_CR204”，“doi-asserted-by”：“crossref”，”unstructured“：”E.Popovici和K。DeJong，\u201c通过适应环境理解竞争性共同进化动力学，\u201在人工多智能体研讨会上发表，2004年AAAI秋季人工智能研讨会的一部分“，“DOI”：“10.1145\/1068009.1068094”}，{“key”：“2631_CR205”，“volume-title”：“合作共同进化计算模型的设计与分析，博士论文，“作者”：“M.Potter”，“年份”：“1997”}，{“密钥”：“2631_CR206”，“doi断言”：“crossref”，“非结构化”：“M.Potter和K.De Jong，u201cA函数优化的合作共同进化方法，u201d，Y.Davidor和H.-P.Schwefel，（编辑）《第三届自然并行问题解决国际会议论文集》（PPSN III），Springer-Verlag，第249\u20132571994页，“DOI”：“10.1007\/3-540-5844-6_269”}，{“issue”：“1”，“key”：“2631_CR207”，“DOI-asserted-by”：“crossref”，“first page”：”1“，“DOI:”10.1162\/10636560056086“，”volume“：”8”，“author”：“M.Potter”，“year”：“2000”，“journal-title“：”演变。计算。}，{“key”：“2631_CR208”，“unstructured”：“M.Potter，K.De Jong，J.J.Grefenstette，学习序列决策规则的协同进化方法，第六届国际遗传算法会议论文集，摩根考夫曼，pp.366\u20133721995”}，}，“key“：”2631_CR2“，“unsructured“：”M.Ponter，L.Meeden，and A。Schultz，《移动机器人共同进化行为中的异质性：专家的出现》，载于《第十七届国际人工智能会议论文集》（IJCAI-2001），2001年“}，{“key”：“2631_CR210”，“doi-asserted-by”：“crossref”，“unstructured”：“N.Puppala，S.Sen，and M。Gordin，\u201cShared memory based cooperative co-evolution，《1998 IEEE计算智能世界大会论文集》，IEEE出版社：美国阿拉斯加安克雷奇，第570\u20135741998页，“DOI”：“10.1109\/ICEC.1998.700091”}，{“key”：“2631_CR211”，“DOI-asserted-by”：“crossref”、“unstructured”：“M。Quinn，《同质多机器人团队进化方法的比较》，载《2001年进化计算大会论文集》（CEC2001），IEEE出版社：COEX，世界贸易中心，159 Samseong-dong，Gangnam-gu，Seoul，Korea，27\u201330 2001，pp.128\u2013135。ISBN 0-7803-6658-1“，”DOI“：”10.1109\/CEC.2001.934381“}，{“key”：“2631_CR212”，“DOI-asserted-by”：“crossref”，”unstructured“：”M.Quinn，\u201cEvolving communication without special communications channels，\u201 d in Advances in Artificial Life:Sixth European Conference on Artificulation Life（ECAL01），2001“DOI”：“10.1007\/3-540-44811-X_38”}，“{”key“：”2631_CR213”，“非结构化”：“M.Quinn、L.Smith、G.Mayley和P.Husbands，同质多机器人系统的进化编队运动：与真实机器人的团队合作和角色分配，认知科学研究论文515。苏塞克斯大学认知与计算科学学院，布赖顿，BN1 9QG。ISSN 1350\u201331622002“}，{”key“：”2631_CR214“，”doi-asserted-by“：”crossref“，”unstructured“：”C.Reynolds，\u201cAn evolved，vision based Behavior model of coordinated group motion，\u201 d in From Animals to Animats 2:Proceedings of the Second International Conference on Simulation of Adaptive Behavior（SAB92），pp.384\u20133921993“，”doi“：”10.7551\/mitpress\/3116.003.0052“}，{“key”：“2631_CR215”，“doi-asserted-by”：“crossref”，“unstructured”：“C.Reynolds，\u201cCompetition，coevolution and game of tag，\u201 d in R.A.Brooks and P.Maes，（eds.）《人工生命IV》，《第四届生物系统合成与模拟国际研讨会论文集》。，麻省理工学院出版社，第59\u201369页，1994年“，“DOI”：“10.7551\/mitpress\/1428.003.0010”}，{“issue”：“4”，“key”：“2631_CR216”，“DOI-asserted-by”：“crossref”，“first page”：”25“，”DOI“：”10.1145\/37406“，”volume“21”，“author”：“C.W.Reynolds”，“year”：“1987”，“journal-title”：“Compute.Graph.”}“，”DOI-asserted-by“：”crossref“，”unstructured“：”P.Riley和M。Veloso，\u201cOn behavior classification in Parker，G.\u2019Bekey，and J.Barhen（eds.），Distributed Autonomous Robotic Systems 4，Springer-Verlag，pp.371_2013380，2000“，“DOI”：“10.1007\/978-4431-67919-6_35”}，{“key”：“2631_CR218”，“unstructured”：“A.Robinson and L。Spector，《使用具有多种数据类型的遗传编程和自动模块化在多智能体系统中进化分散和协调导航》，载于In2019Genetic and Evolutional Computation Conference（GECCO-2002）的最新论文，国际遗传与进化计算学会，2002“}，{“issue”：“1”，“key”：“2631_CR219”，“doi-asserted-by”：“crossref”，“first page”：”1“，“doi”：“10.1162\/evco.1997.5.1.1”，”volume“：”5“，”author“：”C.Rosin“，”year“：”1997“，”journal-title“：”Evol.Comput.Wiering和J。Schmidhuber，《使用多个政策共享代理的学习团队策略：足球案例研究》，技术报告，ISDIA，Corso Elvezia 36，6900 Lugano，Switzerland，1997年，“DOI”：“10.1007”，{“issue”：“2-3”，“key”：“2631_CR221”，“DOI-asserted-by”：“crossref”，“first page”：”263“，“DOI:”10.1023“/A:10075708568”，“volume”：《33》，“author”：“R.”。Salustowicz“，“年份”：“1998年”，“新闻标题”：“机器学习”。“}，{”issue“：”3“，”key“：”2631_CR222“，”doi-asserted-by“：”crossref“，”first-page“：”210“，”doi“：”10.1147\/rd.33.0210“，“volume”：“3”，”author“：”A.Samuel“，”year“：”1994“，”journal-title“：”IBM J.Res.Develop.“}”，{。Crities，\u201cOn multiagent Q-learning in a semi-compactive domain，《半竞争领域中的多智能体Q学习》，《多智能体系统的适应与学习》，第191\u20132051995页，“DOI”：“10.1007\/3-540-60923-7_28”}，{“key”：“2631_CR224”，“unstructured”：“H.Santana，G.Ramalho，V.Corruble，and B。拉蒂奇，《带强化学习的多智能体巡逻》，载于《AAMAS-2004——第三届自治智能体和多智能体系统国际联合会议论文集》，2004年，{“key”：“2631_CR225”，“doi-asserted-by”：“crossref”，《unstructured》：“G.Saunders和J。Pollack，\u201cThe evolution of communication schemes over continuous channels，\u209From Animats to Animats 4-Proceedings of the Fourth International Conference on Adaptive Behaviour，1996，“DOI”：“10.7551\/mitpress\/3118.003.0070”}，{“key”：“2631_CR226”，“DOI-asserted-by”：“crossref”，“unstructured”：“J.Sauter，R.S.Matthews，H。Van Dyke Parunak和S.Brueckner，《进化的自适应信息素路径规划机制》，载于《第一届国际自治代理和多代理系统联合会议论文集》（AAMAS-02），第434页，20134402002年，“DOI”：“10.1145”：“544741.544841”}，{“key”：”2631_CR227“，“unstructured”：“J.Sauter，H.Van Dyce Parunake，S。Brueckner和R.Matthews，《利用进化计算调整合成信息素》，载于R.E.Smith、C.Bonacina、C.Hoile和P.Marrow（编辑），《进化计算和多智能体系统》（ECOMAS），美国加利福尼亚州旧金山，第7页，第00a0页。321\u20133242001“}，{“key”：“2631_CR228”，“unstructured”：“J.Schmidhuber，\u201cRealistic multi-agent reinforcement learning，\u201 d in learning in Distributed Artificial Intelligence Systems，Working Notes of the 1996ECAI Workshop，1996”}，“{”key：“26316_CR229”，“doi-asserted-by”：“crossref”，“非结构化”：“J Schmidhuber and J。赵，使用成功故事算法的多智能体学习，ECAI Workshop LDAIS ICMAS Workshop LIOME中的u201d，第82\u201393页，1996年，“DOI”：“10.1007”-3-540-62934-3_43“}，{“key”：“2631_CR230”，“unstructured”：“J.Schneider，W.-K.Wong，A.Moore，and M。Riedmiller，\u201c分布值函数，\u2018年第十六届国际机器学习会议论文集，第371页\u20133781999年“}，{“key”：“2631_CR231”，“unstructured”：“A.Schultz，J.Grefenstette，and W。Adams，\u201cRobo-shepherd:学习复杂的机器人行为，\u201d《机器人与制造：研究与应用的最新趋势》。第6卷，ASME出版社，第763\u20137681996页“}，{“key”：“2631_CR232”，“unstructured”：“U.M.Schwuttke和A.G.Quan，\u201cEnhanced performance of cooperative agents in realtime diagnostic systems，in Proceedings of the Thirth International Joint Conference on Artificial Intelligence（IJCAI-93），1993”}，}“key:”2631_CR133“，“unsructured。Sekaran和S.Sen，帮助与否，《认知科学学会第十七届年会论文集》，宾夕法尼亚州匹兹堡，第736页，20137411995“}，{“key”：“2631_CR234”，“doi-asserted-by”：“crossref”，“unstructured”：“S。Sen，\u201c多智能体系统：里程碑和新视野\u201d，趋势认知科学。，第1卷，第9期，pp.\u2019334\u20133391997“，“DOI”：“10.1016\/S1364-6613（97）01100-5”}，{“key”：“2631_CR235”，“DOI-asserted-by”：“crossref”，”unstructured“：”S.Sen，\u201c多智能体系统进化和学习专题，《人类计算机研究》，第48卷，第1期，1998年“，”DOI“：”10.1006\/ijhc.1997.0157“}，”{“key”：“2631_CR236”，“doi断言：“crossref”，“非结构化”：“S.Sen和M.Sekaran，\u201c使用互惠来适应他人\u201d，见G.Wei\u00df和S.Sen（编辑），国际人工智能联合会议多智能系统中的适应和学习研讨会，人工智能讲义，Springer Verlag，pp.206\u2013217，1995年”，“DOI”：“10.1007\/3-540-60923-7_29”}，{“key”：“2631_CR237”，“DOI-asserted-by”：“crossref”，“unstructured”：“S.Sen和M.Sekaran，\u201cMultiagent coordination with learning classifier systems\u201d，收录于G.Wei\u00df和S.u2019Sen，（编辑）《IJCAI多智能体系统适应和学习研讨会论文集》，第1042卷，施普林格出版社，第218\u20132331996页。ISBN 3-540-60923-7“，”DOI“：”10.1007\/3-540-60923-7_30“}，{”issue“：”3“，”key“：”2631_CR238“，”DOI-asserted-by“：”crossref“，”first page“：“333”，“DOI”：“10.1080\/095281398146798”，“volume”：“10”，“author”：“S.Sen”，“year”：“1998”，“journal-title”：“J.Exp.Theo.Artif.Intel.”}，”{“key“：”2631_CR239“，”非结构化“：”S.Sen、M.Sekaran和J。Hale，《学习在不共享信息的情况下进行协调》，载于《第十二届全国人工智能会议论文集》，第426页，第2013431页，1994年“}，{“key”：“2631_CR240”，“unstructured”：“Y.Shoham，R.Powers，and T.Grenager，《on the agenda（s）s（s）》《多智能体学习研究》，载于《人工多智能体教学论文集》，2004年美国人工智能学会秋季研讨会论文集。技术报告FS-04\u2013022004“}，{“key”：“2631_CR241”，“unstructured”：“R.Smith和B.Gray，协同自适应遗传算法：othello策略示例，技术报告TCGA 94002，阿拉巴马大学工程科学与力学系，1993年”}，}，“key“：”2631_CR2“，”unstructure“：”L.Spector和J。Klein，通过在breve仿真环境中的可视化发现的进化动力学，第八届国际生命系统仿真与合成会议研讨会论文集，第163\u2013170页，2002年“}，{“key”：“2631_CR243”，“doi-asserted-by”：“crossref”，“unstructured”：“L.Spector，J.Klein、C.Perry和M。Feinstein，《飞行物进化种群中集体行为的出现》，载于E.Cantu-Paz等人（编辑），《遗传与进化计算会议（GECCO）的进展》。Springer-Verlag，2003“，“DOI”：“10.1007\/3-540-45105-6_6”}，{“key”：“2631_CR244”，“DOI-asserted-by”：“crossref”，“unstructured”：“R.Steeb，S.Cammarata，F.Hayes-Roth，P.Thorndyke，and R.Wesson，《机队控制的分布式智能》，载于A.Bond和L.Gasser（eds.）《分布式人工智能阅读》，Morgan Kaufmann Publishers，第90\u2013101页，1988年“，“DOI”：“10.1016\/B978-0-934613-63-7.50011-5”}，{“issue”：“3”，“key”：“2631_CR245”，“DOI-asserted-by”：“crossref”，“first page”：《319》，“DOI:”10.1162\/artl.1995.2.3.319“，”volume“：“2”，“author”：“L.Steels”，“year”：“1995”，“journal-title”：“Artif.Life”}，{“键”：“2631_CR246“，”doi-asserted-by“：”crossref“，”unstructured“：”L.Steels，\u201cEmergent adaptive lexicons，\u 201d in P.Maes，（ed.），《自适应行为模拟会议论文集》。麻省理工学院出版社，1996年，“DOI”：“10.7551\/mitpress\/3118.003.0068”}，{“key”：“2631_CR247”，“unstructured”：“L.Steels，\u201cSelf-organizing vocabularies，\u 201d in Proceedings of Artificial Life V，1996”}、{“key”：”2631_CR2 48“，“volume-title”：“Machine Intelligence 15”，“author”：“L.Steel斯”，“year”：“1996”}.，{”key：“26316_CR249”，“非结构化”：“L。Steels，《使用共同进化、自我组织和层次形成综合语言和意义的起源》，J.Hurford、C.Knight和M.Studdert-Kennedy（编辑），《语言进化的途径：社会和认知基础》，爱丁堡大学出版社，1997年“}”，{“问题”：“4”，“关键”：“2631_CR250”，“doi-asserted-by”：“crossref“，“首页”：“143”，“DOI”：“10.1007\/s001970050001”，“卷”：“8”，“作者”：“L.Steels”，“年份”：“2000”，“日志标题”：“Kognitionswissenschaft”}，{“key”：“2631_CR251”，”DOI-asserted-by“：”crossref.“，”unstructured“：”L.Steelds and F。卡普兰，《集体学习与符号动力学》，载于《欧洲人工生命会议论文集》，第679\u20136881999页，“DOI”：“10.1007\/3-540-48304-7_89”}，{“key”：“2631_CR252”，“unstructured”：“P。Stone，《多智能体系统中的分层学习》，载于《全国人工智能会议论文集》，AAAI，1997年“}，{“key”：“2631_CR253”，“unstructured”：“P.Stone，多智能体中的分层教学，卡内基梅隆大学博士论文，1998年”}，}，“key“：”2631_CR154“，”doi-asserted-by“：”crossref“，”非结构化“：”P.Stone和R.Sutton，《基普韦足球：机器学习试验台》，载于A.Birk、S.Coradeschi和S.Tadokoro，（编辑），《机器人杯2001：机器人足球世界杯V》，计算机科学讲义第2377卷，斯普林格出版社，第214\u20132232002页。ISBN 3-540-43912-9“，”DOI“：”10.1007\/3-540-45603-1_22“}，{”issue“：”3“，”key“：”2631_CR255“，”DOI-asserted-by“：”crossref“，“first page”：“345”，“DOI”：“10.1023\/A:10089420299”，“volume”：”8“，”author“：”P.Stone“，”year“：”2000“，”journal-title“：”Auton.Robots“}”，{“key”：非结构化“：”N.Sturtevant和R。Korf，\u201cOn pruning techniques for multi-layer games，\u 201d in Proceedings of National Conference on Artificial Intelligence（AAAI），pp.201\u20132072000“}，{“key”：“2631_CR257”，“unstructured”：“D.Subramanian，P.Druschel，and J。Chen，\u201cAnts与强化学习：动态网络路由的案例研究，第十五届国际人工智能联合会议论文集（IJCAI-97），第832页\u2013839，1997年“}，{“key”：“2631_CR258”，“doi-asserted-by”：“crossref”，“unstructured”：“N.Suematsu and A。Hayashi，使用扩展最优响应的多智能体强化学习算法，《第一届自主智能体和多智能体系统国际联合会议论文集》（AAMAS-02），第370\u20133772002页，“DOI”：“10.1145\/544741.544831”}，{“key”：“2631_CR259”，“DOI-asserted-by”：“crossref”，“unstructured”：“D。Suryadi和P.J.Gmytrasiewicz，使用影响图学习其他代理的模型，《1999年国际用户建模会议前奏》，第223\u2013232页，1999年，“DOI”：“10.1007\/978-3-7091-2490-1_22”}，{“key”：“2631_CR260”，“首页”：“9”，“卷”：“3”，“作者”：“R.Sutton”，“年份”：“1998”，“新闻标题”：“机器学习。“}，{”key“：”2631_CR261“，”doi-asserted-by“：”crossref“，”unstructured“：”R.Sutton和A.Barto，《强化学习：导论》，麻省理工学院出版社，1998年“，”doi“：”10.1109 \/TNN.1998.712192“}”，{“key”：“2631_CR2”，“doi-assert-by”：“crossreff”，“unstructure”：“J.Svennebring和S。Koenig，\u201cTraillaying robots for robust terraw coverage，\u2018年，《机器人与自动化国际会议论文集》（ICRA-03），2003年，“DOI”：“10.1109\/ROBOT.2003.1241576”}，{“key”：“2631_CR263”，“unstructured”：“P.\u2019t Hoen and K。Tuyls，\u201c使用进化动力学分析多智能体强化学习，《第十五届欧洲机器学习会议（ECML）论文集》，2004年“}，{“key”：“2631_CR264”，“unstructured”：“M.Tambe，实时动态环境中的递归智能体和智能体组跟踪，V.\u2019Lesser和L.Gasser（eds.）中的u201d《第一届多智能体系统国际会议论文集》（ICMAS-95）。AAAI出版社，1995年“}，{”key“：”2631_CR265“，”first page“：“487”，”volume-title“：”Readings in Agents“，”author“：”M.Tan“，”year“：”1993“}”，{“key”：“2631_CR2”，”doi-asserted-by“：”crossref“，”unstructured“：”P.Tangamchit，J.Dolan，and P。Khosla，\u201c合作多机器人学习中平均奖励的必要性，《IEEE机器人与自动化会议论文集》，2002年，“DOI”：“10.1109\/ROBOT.2002.1014721”}，{“issue”：“3”，“key”：“2631_CR267”，“DOI-asserted-by”：“crossref”，“first page”：”58“，“DOI:”10.1145\/203330.20343“，”volume“：”38“，”author“：”G.Tesauro“，”“year”：“1995年，“新闻标题”：“Commun。ACM“}，{”key“：”2631_CR268“，”doi-asserted-by“：”crossref“，”first page“：“289”，”doi“：”10.1023\/A:1015504423309“，”volume“：‘8’，”author“：”G.Tesauro“，”year“：”2002“，”journal-title“：”Auton.Agents Multi-Agent Syst.“}D.G.Tesauro、D.Touretzky和T.Leen（编辑）《神经信息处理系统进展》，麻省理工学院出版社，马萨诸塞州剑桥，第1069\u201310761995页“}，{“key”：“2631_CR270”，“doi-asserted-by”：“crossref”，“unstructured”：“K.Tumer，A.K.Agogino，and D.H。Wolpert，\u201c学习自主智能体集体中的动作序列，\u201d《第一届自主智能体和多智能体系统国际联席会议论文集》（AAMAS-02），第378\u20133852002页，“DOI”：“10.1145\/544741.54444832”｝，｛“key”：“2631_CR271”，“DOI断言者”：“crossref”，“非结构化”：“K.Tuyls，K。Verbeeck和T.Lenaerts，多智能体系统中Q-学习的u201cA选择-变异模型，AAMAS-2003\u2014年第二届国际自主智能体和多智能体联合会议论文集，2003年，“DOI”：“10.1145”：“860575.860687”}，{“key”：”2631_CR272“，“unstructured”：“W.Uther和M。Veloso，\u201c对手强化学习。技术报告CMU-CS-03-107，卡内基梅隆大学计算机科学学院，2003年”，{“关键”：“2631_CR273”，“非结构化”：“H.Van Dyke Parunak，\u201c分布式人工智能在工业中的应用，\u201d in G.M.P.O\u2019Hare和N.R.Jennings，（编辑），分布式人工智能基础。John Wiley&Sons，1996”，{“问题”：”4“，”key“：“2631_CR274”，”doi-asserted-by“：”crossref“，”first page“：”563“，”doi“：”10.1016\/0957-4174（94）90080-9“，“volume”：“7”，“author”：“L.Z.Varga”，“year”：“1994”，“journal-title”：“Int.J.Expert Syst。申请。“｝，｛”key“：”2631_CR275“，”非结构化“：”J.Vidal和E.Durfee，\u201c代理学习代理：框架和分析，\u201d在AAAI-97多代理学习研讨会的工作笔记中，1997“｝，｛”key“：”2631_CR276“，”非结构化“：”J.Vidal和E。Durfee，\u201cThe moving target function problem in Multi-Agent learning，\u2018 d in Proceedings of the Third Annual Conferences on the Multi-Agent Systems，1998“}，{“key”：“2631_CR277”，“doi-asserted-by”：“crossref”，“unstructured”：“J.Vidal and E。Durfee，《预测了解代理的代理的预期行为：CLRI框架》，《自治代理和多代理系统》，2003年1月，“DOI”：“10.1023\/A:1021765422660”}，{“key”：“2631_CR278”，“DOI-asserted-by”：“crossref”，“unstructured”：“K。瓦格纳，《合作战略与传播的演变》，阿蒂夫。《生活》，第6卷，第2期，第149\u2013179页，2000年春，“DOI”：“10.1162\/106454600568384”}，{“key”：“2631_CR279”，“unstructured”：“X.Wang和T.Sandholm，在团队Markov博弈中强化学习发挥最优Nash均衡，《神经信息处理系统进展》（NIPS-2002），2002年”}R.Watson和J.Pollack，最小基质中的协同进化动力学，E.Cantu-Paz等人（编辑），《遗传与进化计算会议论文集》，2001年“}，{“关键”：“2631_CR281”，“非结构化”：“R.Weihmayer和H。Velthuijsen，《分布式人工智能和协同问题解决在电信中的应用》，J.Liebowitz和D.Prereau（编辑），《电信和网络管理的人工智能方法》，IOS出版社，1994年“}，{“key”：“2631_CR282”，“unstructured”：“M.Weinberg和J。Rosenschein，非平稳环境中的最佳响应多智能体学习，AAMAS-2004，2014年第三届国际自主智能体和多智能体系统联合会议论文集，2004年，{“key”：“2631_CR283”，“unstructured”：“G。Wei\u00df，分布式机器学习和组织设计的一些研究。技术报告FKI-189-94，Institute f\u00b4\u2032ur Informatik，TU M\u00fcnchen，1994“}，{”key“：”2631_CR284“，”volume-title“：”Distributed Machine Learning“，”author“：”G.Wei\u00df“，”year“：”1995“}”，{“key”：“2631_CR2 85”，“doi-asserted-by”：“crossref”，“unstructured”：“G。Wei\u00df，ed.，《分布式人工智能遇到机器学习：在多智能体环境中学习》，《人工智能讲义》第1221号，Springer-Verlag，1997年，“DOI”：“10.1007\/3-540-62934-3”}，{“key”：“2631_CR286”，“unstructured”：“G.Wei\u 00df（1998）.\u201c分布式人工智能系统学习专题\u201d。J.专家提奥。Artif公司。智力。10(3).}，{“key”：“2631_CR287”，“unstructured”：“G.Wei\u00df，ed.，《Multiagent Systems:A Modern Approach to Distributed Artificial Intelligence》，麻省理工学院出版社，1999年”}，“{”key：“26316_CR288”，“非结构化”：“G.Wei\f00df and P.Dillenbourg，\u201c\u2018multi\u2019 in multi-agent learning？\u201d in P.Dilenbourg，（ed.）《协作学习、认知和计算方法》，佩加蒙出版社，第64\u201380页，1999年“}，{“key”：“2631_CR289”，“doi-asserted-by”：“crossref”，“unstructured”：“G.Wei\u00df和S.Sen（eds.），《多智能体系统中的适应和学习》，《人工智能》第1042卷讲稿，Springer-Verlag，1996年”，“doi”：“10.1007\/3-540-60923-7“}，{“issue”：“2-3”，“key”：“2631_CR290”，“doi-asserted-by”：“crossref”，”first page“：”179“，”doi“：”10.1023\/A:1007514623589“，”volume“：“33”，”author“：”M.Wellman“，”year“1998”，”journal-title“：”Machine Learn.“}，“卷”：“4”，“作者”：“J.Werfel”，“年份”：“2000年11月”，“新闻标题”：“IEEE传输。进化。计算。“}，{”key“：”2631_CR292“，”unstructured“：”B.B.Werger和M.Mataric，\u201c多机器人团队中的开发实施例，技术报告IRIS-99-378，南加州大学机器人与智能系统研究所，1999年“}”，{“key”：“2631_CR2”，“doi-asserted-by”：“crossref”，“unstructure”：“G.M.Werner和M.G。Dyer，\u201c人工动物中放牧行为的进化，\u201 d in From animals to Animats 2:Proceedings of the Second International Conference on Simulation of Adaptive behavior（SAB92），1993“，“DOI”：“10.7551\/mitpress\/3116.003.0053”}，{“key”：“2631_CR294”，“first page”：”22“volume-title”：“《1998年遗传编程：第三届年会论文集》，“作者”：“T.White”，“年份”：“1998”}，{“key”：“2631_CR295”，“doi-asserted-by”：“crossref”，“unstructured”：“S.Whiteson and P。Stone，\u201cConcurrent layered learning，《AAMAS-2003-第二届国际自治代理和多代理系统联合会议论文集》，2003年，“DOI”：“10.1145”：“860575.860607”}，{“key”：《2631_CR296》，“unstructured”：“R.P。Wiegand，《合作协同进化算法分析》，乔治梅森大学计算机科学系博士论文，2003年“}，{“key”：“2631_CR297”，“unstructured”：“R.P.Wiegand、W.Liles和K.De Jong，《合作共进化算法中协作方法的实证分析》，E.Cantu-Paz等人（编辑）《遗传与进化计算会议论文集》（GECCO），第1235\u201312422001页“}，{“key”：“2631_CR298”，“doi-asserted-by”：“crossref”，“unstructured”：“R.P.Wiegand，W.Liles，and K.De Jong，\u201c用进化博弈论分析合作协同进化，”，D.Fogel，（编辑）《进化计算国会会议记录》（CEC-02），IEEE出版社，第1600\u20131605页，2002年“，“DOI”：“10.1109\/CEC.2002.1004481”}，{“key”：“2631_CR299”，“unstructured”：“R.P.Wiegand，W.Liles，and K.De Jong，使用进化博弈理论对合作协同进化中的变化进行建模，Poli等人[201]中的u201d，第231_2013248页”}key“：”2631_CR300“，”doi-asserted-by“：”crossref“，”unstructured“：”R.P.Wiegand and J.Sarma，\u201c协同进化算法中的空间嵌入和梯度损失，《自然的并行问题解决》中的\u201d-PPSN-2004，Springer，2004年“，”doi“：”10.1007\/978-3-540-30217-9_92“}，{“issue”：“1”，“key”：“2631_CR101”，“doi-assert-by”：“”crossref“，”first page“：”77“，”DOI“：”10.1023\/A:100892191433“，”volume“：“7”，”author“：”M.Wiering“，”year“：”1999“，”journal-title“：”J.Auton“。机器人“}，{“key”：“2631_CR302”，“doi-asserted-by”：“crossref”，《首页》：“165”，‘doi”：“10.1023\/B:AGNT.00001160.45980.4b”，“volume”：”8“，”author“：”A.Williams“，”year“：”2004“，”journal-title“：”Auton.Agents Multi-Agent Syst.“}，{“问题”：“2-3”，“密钥”：“2631_CR304“，”doi-asserted-by“：”crossref“，”first page“：”265“，”doi“：”10.1142 \/S0219525901000188“，“volume”：“4”，“author”：“D.H.Wolpert”，“year”：“2001”，“journal-title”：“Adv.Complex Syst。}，{“key”：“2631_CR305”，“unstructured”：“D.H.Wolpert、K.Tumer和J.Frank，使用集体智能路由互联网流量，\u2019神经信息处理系统进展-11，丹佛，pp.952\u20139581998”}，“{”key“：”2631_CR106“，”doi-asserted-by“：”crossref“，”unstructure“：”D.H.Walpert、K.R.Wheller和K。Tumer，《基于学习的多智能体系统的一般原理》，载于O.Etzioni，J.P.M\u00fcller和J.M.Bradshaw，（编辑），《第三届自主智能体国际会议论文集》（Agents \u201999），ACM出版社：美国华盛顿州西雅图，第77\u201383页，1999年“，“DOI”：“10.1145 \/3011136.301167”}，{“key”：“2631_CR307”，“unstructured”：“M。Wooldridge，S.Bussmann和M.Klosterberg，《生产排序作为协商》，载于《智能代理和多代理技术实际应用第一届国际会议论文集》（PAAM-96），1996年“}，{“key”：“2631_CR308”，“doi-asserted-by”：“crossref”，“unstructured”：“A.Wu，A.Schultz，and A。Agah，\u201cEvolving control for distributed micro air vehicles，《分布式微型飞行器的进化控制》，IEEE计算智能机器人与自动化工程师会议，1999年，“DOI”：“10.1109”：“/CIRA.1999.810045”}，{“密钥”：“2631_CR309”，“DOI-asserted-by”：“crossref”，“非结构化”：“H.Yanco和L。Stein，\u201c协作移动机器人的自适应通信协议，\u2019From Animals to Animats:International Conference on Simulation of adaptive Behavior，pp.478\u20134851993“，”DOI“：”10.7551\/mitpress\/311.6003.0064“｝，｛”key“：”2631_CR310“，”DOI asserted by“：”crossref“，”nonstructured“：”N.Zaera，D.Cliff，and J。Bruten，（非）合成鱼类的进化集体行为，技术报告HPL-96-04，Hewlett-Packard实验室，1996年”，“DOI”：“10.7551\/mitpress\/3118003.0076”}，{“key”：“2631_CR311”，“unstructured”：“B.Zhang和D。Cho，\u201cCoevolutionary fitness switching:Learning complex collective behaviors using genetic programming，《利用遗传编程学习复杂的集体行为》，《遗传编程进展III》，麻省理工出版社，1998年，第425\u2013445页“}，{“key”：“2631_CR312”，“first page”：第9页，“volume-title”：“第四届自适应行为模拟国际会议论文集：从动物到动画4”，“作者”：“J.Zhao”，“年份”：“1996”}]，“容器-时间”：[“自治代理和多代理系统”]，“原始标题”：[]，“语言”：“en”，“链接”：[{“URL”：“http://\/link.springer.com\/content\/pdf\/10007\/s10458-005-2631-2.pdf”，“content-type“：”application\/pdf“，”content-version“：”vor“，”intended-application“：”text-mining“}，{“URL”：“http://\/link.springer.com/article\/10.1007\/s10458-005-2631-2\/fulltext.html”，“content-types”：“text\/html”，“content-version”：“vor”，“intended-application”：“text-mining”}，”{“URL”：“”http:\/\/link.springer.com\/content\/pdf\/10.1007\/s10458-005-2631-2”，“内容类型”：“未指定”，“内容版本”：“vor”，“预期应用程序”：“相似性检查”}]，“存放”：｛“日期部分”：[[2024,1,29]，“日期时间”：“2024-01-29T09:57:37Z”，“时间戳”：1706522257000｝，“分数”：1，“资源”：｛“主要”：｛“URL”：“http:\/\/link.springer.com/10.1007\/s10458-005-2631-2“}}，”副标题“：[]，”短标题“：[]，”已发布“：{”日期-部件“：[[2005,11]]}，“引用计数”：312，“日志发布”：{“发布”：“3”，“发布-打印”：{-“日期-部件”：[[2005年11月]]}}、“alternative-id”：[“2631”]，“URL”：“http://\/dx.doi.org \/10.1007\/s10458-005-2631-2“，”关系“：{}，”ISSN“：[”1387-2532“，”1573-7454“]，“issn-type”：[{“value”：“1387-2532”，“type”:“print”}，{“value”：“1573-4454”，“type”：“electronic”}]，“subject”：[]，“published”：{“date-parts”：[[2005,11]]}}}