博尔沙科夫(V.E.Bolshakov)。;Alfimtsev,A.N。 马尔可夫决策过程中多智能体协作强化学习的层次方法。 (英语。俄文原件) Zbl 07825769号 多克。数学。 108,补遗2,S382-S392(2023); Dokl翻译。罗斯。阿卡德。恶心,Mat.Inform。Protsessy升级。514,第2期,250-261页(2023年)。MSC公司:68T05型 68问题32 60J22型 PDF格式BibTeX公司 XML格式引用 \textit{V.E.Bolshakov}和\textit{A.N.Alfimtsev},Dokl。数学。108、S382——S392(2023;Zbl 07825769);Dokl翻译。罗斯。阿卡德。恶心,Mat.Inform。Protsessy升级。514,编号2,250--261(2023) 全文: 内政部
刘仁科;拉杰什·皮普拉尼;卡洛斯·托罗 一种解决动态车间调度问题的深度多智能体强化学习方法。 (英语) Zbl 07736992号 计算。操作。物件。 159,文章ID 106294,17 p.(2023).MSC公司:900亿 PDF格式BibTeX公司 XML格式引用 \textit{R.Liu}等人,计算机。操作。第159号决议,文章ID 106294,17 p.(2023;Zbl 07736992) 全文: 内政部
顾尚丁;格鲁西安库巴,雅库布;陈元培;杜亚丽;杨龙(Yang,Long);阿洛伊斯·诺尔;杨耀东 多机器人控制的安全多智能体强化学习。 (英语) Zbl 07702947号 Artif公司。智力。 319,文章ID 103905,24 p.(2023).MSC公司:68泰克 PDF格式BibTeX公司 XML格式引用 \textit{S.Gu}等人,Artif。智力。319,文章ID 103905,24 p.(2023;Zbl 07702947) 全文: 内政部 链接
李京晨;吴凡;史浩斌;黄高兴 使用交互式界面的多智能体模型协作。 (英语) Zbl 07825518号 信息科学。 611, 349-363 (2022).MSC公司:68倍 91至XX PDF格式BibTeX公司 XML格式引用 \textit{J.Li}等人,《信息科学》。611349--363(2022;Zbl 07825518) 全文: 内政部
舒什曼·乔杜里;贾耶什·古普塔。;彼得·莫拉莱斯;Mykel J.Kochenderfer。 多代理MDP的可扩展在线规划。 (英语) Zbl 07527541号 J.阿蒂夫。智力。研究(JAIR) 73, 821-846 (2022).MSC公司:68泰克 PDF格式BibTeX公司 XML格式引用 \textit{S.Choudhury}等人,J.Artif。智力。研究(JAIR)73,821--846(2022;Zbl 07527541) 全文: 内政部 arXiv公司
张凯庆;杨卓然;塔梅尔·巴沙尔 多智能体强化学习:理论和算法的选择性概述。 (英语) Zbl 07608712号 Vamvoudakis,Kyriakos G.(编辑)等人,《强化学习和控制手册》。查姆:斯普林格。研究系统。Decis公司。控制325321-384(2021)。MSC公司:68泰克 PDF格式BibTeX公司 XML格式引用 \textit{K.Zhang}等人,研究系统。Decis公司。控制325、321--384(2021;Zbl 07608712) 全文: 内政部 arXiv公司
弗兰斯·奥利埃霍克(Frans A.Oliehoek)。;斯特凡·维特维基;Leslie P.Kaelbling。 结构化多智能体环境中影响的充分统计信息。 (英语) Zbl 1512.68390号 J.阿蒂夫。智力。研究(JAIR) 70, 789-870 (2021).MSC公司:68T42型 68T05型 68分20秒 90立方厘米 91A80型 PDF格式BibTeX公司 XML格式引用 \textit{F.A.Oliehoek}等人,J.Artif。智力。研究(JAIR)70,789--870(2021;Zbl 1512.68390) 全文: 内政部 arXiv公司
拉希德、塔比什;米卡耶尔·萨姆维利安;克里斯蒂安·施罗德·德·维特;格雷戈里·法夸尔;雅各布·福尔斯特;西蒙·怀特森 深度多智能体强化学习的单调值函数分解。 (英语) Zbl 1527.68192号 J.马赫。学习。物件。 21,第178号论文,51页(2020年).MSC公司:68T05型 68T07型 68T42型 PDF格式BibTeX公司 XML格式引用 \textit{T.Rashid}等人,J.马赫。学习。第21号决议,第178号文件,第51页(2020年;兹bl 1527.68192) 全文: arXiv公司 链接
马西米兰·Hüttenrauch;艾德里安·什西奇;格哈德·诺伊曼 群系统的深度强化学习。 (英语) Zbl 1485.68231号 J.马赫。学习。物件。 20,第54号论文,第31页(2019年).MSC公司:68T07型 68T42型 PDF格式BibTeX公司 XML格式引用 \textit{M.Hüttenrauch}等人,J.Mach。学习。第20号决议,第54号论文,第31页(2019年;Zbl 1485.68231) 全文: arXiv公司 链接