×

对抗微分对策的最优策略分析。 (英语) 兹比尔1512.91016

摘要:由于参与者之间的复杂互动,对抗性微分博弈中的最优决策和赢区分析是具有挑战性的理论问题。为了解决这些问题,我们对追踪-渗透游戏、可达-无效游戏和捕获-滞后游戏进行了有组织的回顾;我们还概述了三类游戏的最新发展。首先,我们总结了追踪游戏的最新结果,并根据不同的玩家数量对其进行分类。作为一种特殊的追击游戏,本文从玩家不同的速度比的角度分析了带有主动目标的目标攻击防御游戏。其次,从分析方法和几何方法两个方面比较了可达-无效对策和捕获-滞后对策的相关工作。这些方法对参与者之间的障碍和最优策略分析有不同的影响。最后讨论了寻踪博弈、可达-无效博弈、捕获-滞后博弈及其应用的未来发展方向。

MSC公司:

91A24型 位置游戏(追逐和回避等)
91A23型 微分对策(博弈论方面)
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] R、 多人到达的任务分配通过分析障碍避免凸域中的游戏,IEEE Trans。罗布。,36, 107-124 (2019) ·doi:10.1109/TRO.2019.2935345
[2] E.Garcia,I.Weintraub,D.W.Casbeer,M.Pachter,三维保护飞机游戏的最佳策略,预印本,arXiv:2202.01826。
[3] E、 圆形区域微分对策的最优策略,IEEE控制系统。莱特。,4, 492-497 (2019) ·doi:10.1109/LCSYS.2019.2963173
[4] J、 《一名优秀躲避者的多人追逐游戏》,Automatica,71,24-32(2016)·Zbl 1343.49063号 ·doi:10.1016/j.automatica.2016.04.012
[5] K、 具有对抗性交互的交换拓扑下的网络领导者选择,Automatica,142110334(2022)·Zbl 1494.93044号 ·doi:10.1016/j.automatica.2022.110334
[6] Z、 多功能砂矿元件分配优化的细胞分裂遗传算法,IEEE Trans。Ind.Inf.,18559-570(2021年)·doi:10.109/TⅡ.20213069459
[7] Y、 学习时代自主系统的感知和决策概述,IEEE Trans。神经网络学习。系统。(2022) ·doi:10.1109/TNNLS.2022.3167688
[8] E、 多重追击多重躲避微分游戏,IEEE Trans。自动。控制,662345-2350(2020)·Zbl 07352160号 ·doi:10.1109/TAC.2020.3003840
[9] E、 三维空间中一类多层可达-无效微分对策的最优策略,IEEE Rob。自动。莱特。,5, 4257-4264 (2020) ·doi:10.1109/LRA.2020.2994023
[10] H、 自动化辅助捕获-滞后:差分博弈方法,IEEE Trans。控制系统。技术。,23, 1014-1028 (2014) ·doi:10.1109/TCST.2014.2360502
[11] Z.Zhou,J.Huang,J.Xu,Y.Tang,捕获-滞后博弈的两阶段联合最优策略和获胜区域IECON 2021-IEEE工业电子学会第47届年会, (2021), 1-6. https://doi.org/10.109/IECON48115.2021.9589624
[12] E.Garcia,A.V.Moll,D.W.Casbeer,M.Pachter,《防御多个攻击者的海岸线战略》,年2019年IEEE第58届决策与控制会议(CDC), (2019), 7319-7324. https://doi.org/10.109/CDC40024.2019.9029340
[13] I.E.Weintraub,M.Pachter,E.Garcia,追击规避差分博弈简介2020年美国控制会议(ACC), (2020), 1049-1066. https://doi.org/10.23919/ACC45564.2020.9147205
[14] T、 动态和差分游戏教程,Dyn。游戏应用程序。经济。,1-25 (1986) ·Zbl 0586.90102号 ·doi:10.1007/978-3-642-61636-5_1
[15] S、 具有多个对象的零和追踪-扩散微分游戏:出版物调查,Dyn。游戏应用。,7, 609-633 (2017) ·Zbl 1391.91051号 ·doi:10.1007/s13235-016-0209-z
[16] R.Yan、Z.Shi、Y.Zhong,《环形区域内的防御游戏》2017年IEEE第56届决策与控制年会(CDC), (2017), 5590-5595. https://doi.org/10.1109/CDC.2017.8264502
[17] I.E.Weintraub、A.V.Moll、E.Garcia、D.Casbeer、Z.J.Demers、M.Pachter,《速度较慢的观测器对速度较快的非机动目标的最大观测》,年2020年美国控制会议(ACC), (2020), 100-105. https://doi.org/10.23919/ACC45564.2020.9147340
[18] J、 合作与竞争多智能体系统:从优化到游戏,IEEE/CAA J.Autom。罪。,9, 763-783 (2022) ·doi:10.1109/JAS.2022.105506
[19] A.A.Al-Talabi,等速多人追踪-渗透微分游戏,in2017年国际自动控制大会(CACS), (2017), 1-6. https://doi.org/10.1109/CACS.2017.8284276
[20] D、 多层次外围防御游戏的合作团队策略,IEEE Rob。自动。莱特。,5, 2738-2745 (2020) ·doi:10.1109/LRA.2020.2972818
[21] E、 合作二熊一逃微分博弈的几何方法,IFAC-PapersOnLine,50,15209-15214(2017)·doi:10.1016/j.ifacol.2017.08.2366
[22] A、 多人单避游戏,J.Intell。罗布。系统。,96, 193-207 (2019) ·doi:10.1007/s10846-018-0963-9
[23] E.Garcia,S.D.Bopardikar,合作遏制高速逃逸者,年2021年美国控制会议(ACC), (2021), 4698-4703. https://doi.org/10.23919/ACC50511.2021.9483097
[24] E.Garcia、D.W.Casbeer、D.Tran、M.Pachter,《超视距战术的差分游戏方法》2021年美国控制会议(ACC), (2021), 3210-3215. https://doi.org/10.23919/ACC50511.2021.9482650
[25] Y、 带有恶意追捕者的多人追捕扩散微分游戏,IEEE Trans。自动。控制(2022)·Zbl 07740998号 ·doi:10.1010/TAC.2022.3168430
[26] W、 《涉及有限观测值的追踪-扩散微分博弈的纳什策略》,IEEE Trans。Aerosp公司。电子。系统。,51, 1347-1356 (2015) ·doi:10.1109/TAES.2014.130569
[27] M.Pachter,E.Garcia,D.W.Casbeer,主动目标防御差异游戏,in2014年第52届阿勒顿通信、控制和计算年会(阿勒顿), (2014), 46-53. https://doi.org/10.109/ALLERTON.2014.7028434
[28] E、 使用一级导弹模型进行主动目标防御,Automatica,78,139-143(2017)·Zbl 1357.49140号 ·doi:10.1016/j.automatica.2016.12.032
[29] M.Coon,D.Panagou,具有双积分动力学的多人目标攻击-防御微分游戏的控制策略,in2017年IEEE第56届决策与控制年会(CDC), (2017), 1496-1502. https://doi.org/10.109/CDC.2017.8263864
[30] I.E.Weintraub、E.Garcia、M.Pachter,《非机动飞机主动防御的运动学再结合方法》2018年美国控制年会(ACC), (2018), 6533-6538. https://doi.org/10.23919/ACC.2018.8431129
[31] E、 主动防御微分博弈状态反馈优化策略的设计与分析。自动。控制,64,553-568(2018)·Zbl 1482.49041号 ·doi:10.1109/TAC.2018.2828088
[32] E.Garcia,D.W.Casbeer,M.Pachter,目标攻击-防御差异博弈中的最优目标捕获策略,in2018年美国控制年会(ACC), (2018), 68-73. https://doi.org/10.23919/ACC.2018.8431715
[33] E、 主动目标防御的完全微分游戏,J.Optim。理论应用。,191, 675-699 (2021) ·Zbl 1482.91028号 ·doi:10.1007/s10957-021-01816-z
[34] E、 在防守队员戴恩面前追击。游戏应用。,9, 652-670 (2019) ·Zbl 1431.91043号 ·doi:10.1007/s13235-018-0271-9
[35] M、 针对主动目标防御差异游戏Dyn的解决方案。游戏应用。,9, 165-216 (2019) ·Zbl 1411.91112号 ·doi:10.1007/s13235-018-0250-1
[36] E、 针对高级攻击者的协同目标保护,Automatica,131109696(2021)·Zbl 1478.91019号 ·doi:10.1016/j.automatica.2021.109696
[37] M.Pachter、E.Garcia、R.Anderson、D.W.Casbeer、K.Pham,《主动目标防御差异游戏中目标寿命最大化》2019年第18届欧洲控制会议(ECC), (2019), 2036-2041. https://doi.org/10.23919/ECC.2019.8795650
[38] E.Garcia,D.W.Casbeer,M.Pachter,《目标对智能对手的防御:线性二次公式》,年2020年IEEE控制技术与应用会议(CCTA), (2020), 619-624. https://doi.org/10.109/CCTA41146.2020.9206368
[39] E、 针对攻击导弹的最佳飞机防御合作策略,J.Guid。,控制,动态。,38, 1510-1520 (2015) ·网址:10.2514/1.G001083
[40] 五十、 合作目标防御的微分博弈,Automatica,102,58-71(2019)·Zbl 1411.91111号 ·doi:10.1016/j.automatica.2018.12.034
[41] Z、 可达-无效问题中的高效路径规划算法,Automatica,89,28-36(2018)·Zbl 1387.49054号 ·doi:10.1016/j.automatica.2017.11.035
[42] P.Shi,W.Sun,X.Yang,I.J.Rudas,H.Gao,带齿槽力补偿的双驱动龙门台主从同步控制,IEEE传输。系统。网络人:系统。, https://doi.org/10.109/TSMC.2022.3176952
[43] J.Lorenzetti,M.Chen,B.Landry,M.Pavone,通过混合整数二阶锥规划的Reach-avoid游戏2018 IEEE决策与控制会议(CDC), (2018), 4409-4416. https://doi.org/10.109/CDC.2018.8619382
[44] R、 《微分游戏:它们的范围、性质和未来》,J.Optim。理论应用。,3, 283-295 (1969) ·Zbl 0172.13403号 ·doi:10.1007/BF00931368
[45] R、 由两名防御者和一名攻击者在高维空间中保护子空间,IEEE Trans。赛博。(2020) ·doi:10.1109/TCYB.2020.3015031
[46] R.Yan,Z.Shi,Y.Zhong,在三维空间中,四名速度相等的选手的触达障碍规避差分游戏的构建2019年IEEE第58届决策与控制会议(CDC), (2019), 4067-4072. https://doi.org/10.109/CDC40024.2019.9029495
[47] K、 可达无效微分对策的Hamilton-jacobi公式,IEEE Trans。自动。对照,561849-1861(2011)·Zbl 1368.49044号 ·doi:10.1109/TAC.2011.2105730
[48] J.F.Fisac,M.Chen,C.J.Tomlin,S.S.Sastry,《具有时变动力学、目标和约束的Reach-avoid问题》HSCC’15:第18届混合系统国际会议论文集:计算与控制, (2015), 11-20. https://doi.org/10.1145/2728606.2728612 ·Zbl 1364.49048号
[49] M、 通过两两结果的多人可达无效游戏,IEEE Trans。自动。控制,621451-1457(2016)·Zbl 1366.91020号 ·doi:10.1109/TAC.2016.2577619
[50] V.Mnih,K.Kavukcuoglu,D.Silver,A.Graves,I.Antonoglou,D.Wierstra等人,《用深度强化学习演奏atari》,预印本,arXiv:1312.5602。
[51] S.Bansal,C.J.Tomlin,《深度学习:高维可达性的深度学习方法》2021年IEEE机器人与自动化国际会议(ICRA), (2021), 1817-1824. https://doi.org/10.109/ICRA48506.2021.9561949
[52] J.Li,D.Lee,S.Sojoudi,C.J.Tomlin,《通过深度强化学习实现零和游戏的无限性》,预印本,arXiv:2203.10142。
[53] K.C.Hsu,V.R.Royo,C.J.Tomlin,J.F.Fisac,《通过无障碍强化学习确保安全和活力》,预印本,arXiv:2112.12288。
[54] E.Garcia,D.W.Casbeer,A.V.Moll,M.Pachter,《合作的二熊一避阻挡微分对策》2019年美国控制会议(ACC), (2019), 2702-2709. https://doi.org/10.23919/ACC.2019.8814294
[55] R、 基于匹配的三维异构多人游戏捕获策略,避免差异游戏,Automatica,140110207(2022)·Zbl 1486.91013号 ·doi:10.1016/j.automatica.2022.110207
[56] J、 一个有单个逃避者和多个追捕者的可达无效游戏的反馈策略,IEEE Trans。赛博。,51, 696-707 (2019) ·doi:10.1109/TCYB.2019.2914869
[57] E.Garcia、D.W.Casbeer、M.Pachter、J.W.Curtis、E.Doucette,《防守目标的两队线性二次微分游戏》2020年美国控制会议(ACC), (2020), 1665-1670. https://doi.org/10.23919/ACC45564.2020.9147665
[58] S、 合作杀人司机游戏,Automatica,451771-1777(2009)·Zbl 1184.49039号 ·doi:10.1016/j.automatica.2009.03.014
[59] R、 差速驱动圆盘机器人的最佳导航:与多边形环境对抗的游戏,J.Intell。罗布。系统。,89, 211-250 (2018) ·doi:10.1007/s10846-016-0433-1
[60] A、 拦截流氓机器人:一种用多个追踪者捕捉多个逃犯的算法,IEEE Rob。自动。莱特。,2, 530-537 (2016) ·doi:10.1109/LRA.2016.2645516
[61] Z、 与voronoi分区的合作追求,Automatica,72,64-72(2016)·Zbl 1344.49065号 ·doi:10.1016/j.automatica.2016.05.007
[62] E、 使用动态voronoi图接力追踪机动目标,Automatica,482213-2220(2012)·Zbl 1257.93003号 ·doi:10.1016/j.automatica.2012.06.003
[63] R、 两名防守球员和一名进攻球员的无障碍比赛:分析方法,IEEE Trans。赛博。,49, 1035-1046 (2018) ·doi:10.1109/TCYB.2018.2794769
[64] R、 两避一追击者的合作策略可达-空微分对策,国际J.系统。科学。,52, 1894-1912 (2021) ·Zbl 1483.91045号 ·doi:10.1080/00207721.2021.1872116
[65] J、 基于深度强化学习的不完全信息群体智能捕获-延迟博弈。罪。Technol公司。(2021) ·doi:10.1360/SST-2021-0382
[66] 一、 连续动态博弈可达集的含时hamilton-jacobi公式,IEEE Trans。自动。控制,50947-957(2005)·Zbl 1366.91022号 ·doi:10.1010/TAC.2005.851439
[67] E.Garcia,D.W.Casbeer,M.Pachter,捕获-滞后微分对策2018 IEEE决策与控制会议(CDC), (2018), 4167-4172. https://doi.org/10.109/CDC.2018.8619026
[68] M.Pachter、D.W.Casbeer、E.Garcia,《捕获-时滞:微分博弈》,年2020年IEEE控制技术与应用会议(CCTA), (2020), 606-610. https://doi.org/10.109/CCTA41146.2020.9206333
[69] Z、 具有不确定性和干扰的双电机驱动系统的无近似鲁棒同步控制,IEEE Trans。Ind.Electron公司。,69, 10500-10509 (2021) ·doi:10.1109/TIE.2021.3137619
[70] Y.Tang,X.Jin,Y.Shi,W.Du,采用无速度测量的多刚体系统的事件触发姿态同步,Automatica公司,正在印刷中·Zbl 1497.93142号
[71] X、 事件触发的绝对和相对姿态测量的姿态一致性,Automatica,122109245(2020)·Zbl 1451.93239号 ·doi:10.1016/j.automatica.2020.109245
[72] R、 追击游戏中电子对抗的博弈和信息论分析,IEEE Trans。系统。人类网络。A部分系统。人类,38,1281-1294(2008)·doi:10.1109/TSMCA.2008.2003970
[73] J、 用于未知环境中多机器人实时协作狩猎的仿生神经网络,IEEE Trans。神经网络,222062-2077(2011)·doi:10.1109/TNN.2011.2169808
[74] J、 空战仿真模型的博弈论验证和分析,IEEE Trans。系统。人类网络。A部分系统。人类,401057-1070(2010)·doi:10.1109/TSMCA 2010.2044997
[75] Z.E.Fuchs,P.P.Khargonekar,J.Evers,《单追捕者内的合作防御,双追捕者-逃逸微分对策》,in第四十九届IEEE决策与控制会议(CDC), (2010), 3091-3097. https://doi.org/10.109/CDC.2010.5717894
[76] B.Goode、A.Kurdila、M.Roan,《使用一步纳什平衡的声学传感追踪扩散》,年2010年美国控制会议记录, (2010), 1925-1930. https://doi.org/10.1109/ACC.2010.5531356
[77] Y、 DoS攻击下非线性多智能体系统基于事件的编队控制,IEEE Trans。自动。对照组,66452-459(2020)·Zbl 07320171号 ·doi:10.1109/TAC.2020.2979936
[78] S、 通过强化学习实现多个欧拉-拉格朗日系统的无模型事件触发最优一致性控制,IEEE Trans。网络科学。工程师,8246-258(2020)·doi:10.1109/TNSE.2020.3036604
[79] H、 梁头表面贴装机PCB装配优化的分层多目标启发式算法,IEEE Trans。赛博。(2021) ·doi:10.1109/TCYB.2020.3040788
[80] Y、 随机脉冲非线性系统的输入-状态稳定性,Automatica,113108766(2020)·兹比尔1440.93220 ·doi:10.1016/j.automatica.2019.108766
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。