×

资源不确定性和多周期承诺下的国防和安全规划。 (英语) Zbl 1527.91042号

概述:公共部门的特点是等级分明、相互依存的组织。特别是对于防御和安全应用程序,更高的权限通常负责在下级组织之间分配资源。这些下属组织基于不确定的资源和不确定的经营环境进行长期规划。本文开发了一个建模框架和多种解决方案方法,供下属组织在这种情况下使用。我们通过分解为马尔可夫决策过程,将对抗性风险分析方法扩展到随机博弈。这允许下级组织以贝叶斯方式编码其信念,以便建立长期政策,以最大限度地发挥其预期效用。我们开发的建模框架在一个现实的反恐用例中进行了说明,我们的解决方案的效力通过与替代构建的政策进行比较来评估。
{©2022威利期刊有限责任公司。本文由美国政府雇员撰写,他们的作品在美国属于公共领域。}

MSC公司:

91B05型 风险模型(通用)
91A15型 随机对策,随机微分对策
90立方厘米 马尔可夫和半马尔可夫决策过程
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Albrecht,S.V.、Crandall,J.W.和Ramamorthy,S.(2016)。假设行为中的信念和真理。人工智能,235,63-94·Zbl 1352.68259号
[2] Albrecht,S.V.和Ramamoorthy,S.(2015)。多智能体系统中临时协调的博弈模型和最佳响应学习方法。arXiv预打印arXiv:1506.01170。
[3] Andersen,S.、Fountain,J.、Harrison,G.W.和Rutström,E.E.(2014)。估计主观概率。《风险与不确定性杂志》,48(3),207-229。
[4] Banks,D.、Gallego,V.、Naveiro,R.和Ríos Insoa,D.(2020年)。对手风险分析:概述(e1530)。威利跨学科评论:计算统计学。
[5] Banks,D.、Petralia,F.和Wang,S.(2011年)。对手风险分析:Borel游戏。《商业和工业中的应用随机模型》,27(2),72-86·Zbl 1276.91008号
[6] Banks,D.L.、Aliaga,J.M.R.和Insua,D.R.(2015)。对手风险分析。CRC出版社。
[7] Berger,J.O.(2013)。统计决策理论和贝叶斯分析。施普林格科技与商业媒体。
[8] Bertsimas,D.和Demir,R.(2002年)。多维背包问题的一种近似动态规划方法。管理科学,48(4),550-565·Zbl 1232.90322号
[9] Brown,G.G.、DeGrange,W.C.、Price,W.L.和Rowe,A.A.(2017)。为美国海军安排海上作战后勤部队补充。海军研究后勤,64(8),677-693·Zbl 1411.90206号
[10] Brown,N.和Sandholm,T.(2019年)。多人扑克的超级人工智能。《科学》,365(6456),885-890·Zbl 1433.68316号
[11] Caballero,W.N.、Jenkins,P.R.和Keith,A.J.(2021)。在设计时毒害有限时域马尔可夫决策过程。计算机与运筹学,129105185·兹比尔1510.90284
[12] Caballero,W.N.和Lunday,B.J.(2019年)。影响建模:风险或不确定性下说服力的数学规划表示。欧洲运筹学杂志,278(1),266-282·Zbl 1431.91101号
[13] Caballero,W.N.和Lunday,B.J.(2020年)。结构和参数不确定性下的稳健影响建模:阿富汗禁毒用例。决策支持系统,128,113161。
[14] Caballero,W.N.、Lunday,B.J.和Uber,R.P.(2020年)。在不同形式的不确定性下,确定正常形式游戏的行为稳健策略。欧洲运筹学杂志,288(3),971-982·Zbl 1487.91005号
[15] Camerer,C.和Hua Ho,T.(1999)。在正常形式的游戏中体验加权吸引学习。《计量经济学》,67(4),827-874·Zbl 1055.91504号
[16] Camerer,C.F.(2004)。行为博弈论:预测战略情境中的人类行为。C.F.Camerer(编辑)、G.Loewenstein(编辑)和M.Rabin(编辑),《行为经济学进展》(第374-392页)。普林斯顿大学出版社。
[17] Camerer、C.F.、Ho、T.‐H.和Chong,J.‐K。(2002). 在重复游戏中进行复杂的经验加权吸引学习和策略教学。《经济理论杂志》,104(1),137-188·Zbl 1015.91011号
[18] Cano,J.、Insua,D.R.、Tedeschi,A.和Turhan,U.(2014年)。安全经济学:机场保护的多目标对抗性风险分析方法。《运筹学年鉴》,245,359‐378。https://doi.org/10.1007/s10479‐014‐1690‐7 ·Zbl 1406.91129号 ·doi:10.1007/s10479‐014‐1690‐7
[19] Chatterjee,K.、Majumdar,R.和Henzinger,T.A.(2008年)。随机极限平均游戏是在exptime中。《国际博弈论杂志》,37(2),219-234·Zbl 1154.91004号
[20] Clyde,M.和George,E.I.(2004年)。模型不确定性。统计科学,19,81-94·Zbl 1062.62044号
[21] Cohen,R.、Beauchamp‐Mustafaga,N.、Cheravitch,J.、Demus,A.、Harold,S.、Horning,J.、Jun,J.、Schwille,M.、Treyger,E.和Vest,N.(2021)。打击社交媒体上的外国虚假信息:研究综述和结论(技术报告)。加州圣莫尼卡兰德公司。
[22] 国会研究服务(2020)。防御入门:规划、编程、预算和执行(PPBE)过程。https://crsreports.congress.gov/product/pdf/IF/IF10429
[23] Cox,L.A.,Jr.(2013)。改进风险分析中的因果推断。风险分析,33(10),1762-1771。
[24] Doshi,P.和Gmytrasiewicz,P.J.(2006)。关于在互动pomdps中实现平衡的困难。《全国人工智能会议记录》(第21卷,第1131页)。加利福尼亚州门罗公园;马萨诸塞州剑桥市;伦敦:AAAI出版社;麻省理工学院出版社。
[25] Farquhar,P.H.和Nakamura,Y.(1988年)。多项式指数函数的效用评估程序。海军研究后勤,35(6),597-613·Zbl 0661.90005号
[26] Fink,A.M.(1964年)。随机n人博弈中的均衡。《广岛大学科学杂志》,28(1),89-93·Zbl 0126.36506号
[27] French,S.(2020年)。在平行的小世界中公理化贝叶斯范式。运筹学,70(3),1293-1952。
[28] 加列戈,V.、纳韦罗,R.、因苏阿,D.R.和奥泰扎,D.G.-U。(2019). 对手意识强化学习。arXiv预打印arXiv:1908.08773。
[29] Geiger,D.、Verma,T.和Pearl,J.(1990年)。识别贝叶斯网络中的独立性。网络,20(5),507-534·Zbl 0724.05066号
[30] Hamid,S.(2021)。美国人从来没有像塔利班那样了解阿富汗。https://www.brookings.edu/opinions/美国人从未被理解的阿富汗就像塔利班一样/
[31] McGarry,B.W.和Heidi,P.M.(2018年)。国防入门:规划、编程、预算和执行(PPBE)过程。国会研究服务中心,聚焦,IF10429。
[32] Ho,T.H.、Camerer,C.F.和Chong,J.‐K。(2007). 自我调节体验加权游戏中的吸引力学习。《经济理论杂志》,133(1),177-198·Zbl 1280.91028号
[33] Ho、T.‐H.、。,帕克、东南部和Su,X.(2020年)。n人博弈中的贝叶斯水平k模型。管理科学,67(3),1329-1992。
[34] Ho、T.‐H.和Su,X.(2013)。序列游戏中的动态水平k模型。管理科学,59(2),452-469。
[35] Hoeting,J.A.、Madigan,D.、Raftery,A.E.和Volinsky,C.T.(1999)。贝叶斯模型平均:教程。统计科学,14(4),382-401·Zbl 1059.62525号
[36] 霍华德·R·A(1980)。对决策分析的评估。运筹学,28(1),4-27。
[37] Hu,J.和Wellman,M.P.(2003)。一般和随机博弈的Nash q学习。机器学习研究杂志,4(11月),1039-1069·Zbl 1094.68076号
[38] Hunt,K.、Agarwal,P.和Zhung,J.(2021)。机场安全技术采用:在攻防游戏中模拟公开披露和保密。可靠性工程与系统安全,207107355。
[39] Jenkins,P.R.、Robbins,M.J.和Lunday,B.J.(2020年)。军事医疗后送调度策略的近似动态规划。《计算机杂志》,33,2-26·Zbl 1466.90010号
[40] Jose,V.R.R.和Zhuang,J.(2013)。多阶段攻防游戏中的技术采用、积累和竞争。军事行动研究,18(2),33-47。
[41] Joshi,C.、Rios,J.和Insua,D.R.(2020)。内部威胁建模:对抗性风险分析方法。IEEE信息取证和安全事务。电气与电子工程师协会。
[42] Kadane,J.B.和Larkey,P.D.(1982年)。主观概率和博弈论。管理科学,28(2),113-120。
[43] Keeney,R.L.(2008)。应用价值导向思维。军事行动研究,13(2),7-17。
[44] Koller,D.和Milch,B.(2003年)。用于表示和解决游戏的多代理影响图。游戏与经济行为,45(1),181-221·Zbl 1054.91007号
[45] Kronqvist,J.、Bernal,D.E.、Lundell,A.和Grossmann,I.E.(2019年)。凸minlp解的回顾与比较。优化与工程,20(2),397-455。
[46] Law,Y.W.、Alpcan,T.和Palaniswami,M.(2014)。自动发电控制中风险最小化的安全游戏。IEEE电力系统汇刊,30(1),223-232。
[47] Lin,K.Y.、Atkinson,M.P.和Glazebrook,K.D.(2014)。当检测不完善时,优化巡逻以及时发现威胁。海军研究后勤,61(8),557-576·Zbl 1411.90175号
[48] Meehan,M.K.(2007)。执法红队。警察局长,74(2),1-5。
[49] 北约(2019)。AJP‐5:盟军联合作战规划原则。https://assets.publishing.service.gov.uk/government/uploads/system/uploads\attachment_data/file/837082/dcdc_doctrine_nato_planning_of_ops_ajp_5.pdf。
[50] Neyman,A.、Sorin,S.和Sorin(2003)。随机游戏和应用(第570卷)。施普林格科技与商业媒体·Zbl 1027.00040号
[51] Nowak,A.S.和Raghavan,T.(1992年)。折扣随机博弈中具有对称信息的平稳相关均衡的存在性。运筹学数学,17(3),519-526·Zbl 0761.90112号
[52] O'Hagan,A.、Buck,C.E.、Daneshkhah,A.,Eiser,J.R.、Garthwaite,P.H.、Jenkinson,D.J.、Oakley,J.E.和Rakow,T.(2006年)。不确定判断:引诱专家的概率。约翰·威利父子公司·兹比尔1269.62009
[53] Panella,A.和Gmytrasiewicz,P.(2016)。交互式pomdps中其他代理有限控制器的贝叶斯学习。第30届AAAI人工智能大会论文集(第30卷)。
[54] Perea,A.(2012年)。认知博弈论:推理与选择。剑桥大学出版社。
[55] 鲍威尔·W·B(2007)。近似动态规划:解决维度的诅咒(第703卷)。约翰·威利父子公司·Zbl 1156.90021号
[56] 鲍威尔·W·B(2019)。随机优化的统一框架。《欧洲运筹学杂志》,275(3),795-821·Zbl 1430.90445号
[57] Puterman,M.L.(2014)。马尔可夫决策过程:离散随机动态规划。约翰·威利父子公司。
[58] Raiffa,H.(1982)。谈判的艺术和科学。哈佛大学出版社。
[59] Rios Insoa,D.、Banks,D.和Rios,J.(2016)。在对抗性风险分析中建模对手。风险分析,36(4),742-755。
[60] Rios,J.和Insua,D.R.(2012年)。反恐建模的对手风险分析。风险分析:国际期刊,32(5),894-915。
[61] Roponen,J.、Insua,D.R.和Salo,A.(2020年)。部分信息下的对手风险分析。欧洲运筹学杂志,287306-316·Zbl 1443.91117号
[62] Rosenberg,D.、Solan,E.和Vieille,N.(2004)。单控制器不完全信息随机博弈。SIAM控制与优化杂志,43(1),86-110·Zbl 1101.91001号
[63] Sevillano,J.C.、Rios Insoa,D.和Rios,J.(2012)。对手风险分析:索马里海盗案。决策分析,9(2),86-95·Zbl 1398.91202号
[64] Shapley,L.S.(1953年)。随机艾姆斯。《美国国家科学院院刊》,39(10),1095-1100·Zbl 0051.35805号
[65] Sidford,A.、Wang,M.、Yang,L.和Ye,Y.(2020年)。求解具有近似最优时间和样本复杂度的折扣随机双人博弈。《国际人工智能与统计会议记录》(第2992‐3002页)。PMLR公司。
[66] Solan,E.(2001)。随机博弈中相关均衡的特征。国际博弈论杂志,30(2),259-277·兹比尔1082.91028
[67] Solan,E.和Vieille,N.(2002年)。随机博弈中的相关均衡。游戏与经济行为,38(2),362-399·Zbl 1022.91007号
[68] Solis,G.D.(2016)。武装冲突法:战争中的国际人道主义法。剑桥大学出版社。
[69] Sonu,E.和Doshi,P.(2012年)。有限嵌套交互式pomdps的广义和有界策略迭代:扩展。第11届自主代理和多代理系统国际会议记录(第2卷,第1039‐1048页)。
[70] Stahl,D.O.(1993)。智能玩家的发展。游戏与经济行为,5(4),604-617·Zbl 0801.90144号
[71] Stahl,D.O.和Wilson,P.W.(1995)。关于其他球员的球员模型:理论和实验证据。游戏与经济行为,10(1),218-254·Zbl 0831.90135号
[72] Sutton,R.S.和Barto,A.G.(2018年)。强化学习:简介。麻省理工学院出版社·Zbl 1407.68009号
[73] 美国空军(2019年)。空军条令核心条令,附件3-10:部队保护。https://www.doctrine.af.mil/doctrine网站‐附录/附录‐3‐10‐武力保护/
[74] 美国国土安全部(2011)。国家恐怖主义咨询系统公共指南。https://www.dhs.gov/xlibrary/assets/ntas/ntas网站‐公共指南.pdf
[75] 美国国土安全部(2020年)。国土安全演习和评估计划(HSEEP)。https://www.fema.gov/sites/default/files/2020‐04/国土安全‐演习和评估‐计划‐条令‐2020‐修订版‐2‐25.pdf
[76] 美国国务院(2019年)。安全信息:旅行咨询。https://travel.state.gov/content/travel/en/国际旅行/出发前/关于我们的新产品.html
[77] 美国参谋长联席会议(2017a)。联合出版物1-0:美国武装部队条令。https://www.jcs.mil/Portals/36/Documents/Doctrine/pubs/jp1_ch1.pdf
[78] 美国参谋长联席会议(2017b)。联合出版物5-0:联合规划。https://www.jcs.mil/Portals/36/Documents/Doctrine/pubs/jp5_0_20171606.pdf
[79] Wang,S.和Banks,D.(2011年)。叛乱网络路由:对抗性风险分析框架。海军研究后勤,58(6),595-607·Zbl 1267.91024号
[80] Zhung,J.、Bier,V.M.和Alagoz,O.(2010年)。在多周期攻击防御信号游戏中建模保密和欺骗。《欧洲运筹学杂志》,203(2),409-418·Zbl 1177.91053号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。