×

可重组受限有限状态机:定义和求解方法。 (英语) Zbl 1454.93209号

摘要:许多现实世界的系统在动态变化的环境中使用有限的资源进行操作和决策,在这种环境中,变化可能是不可预测的。本文定义了受限有限状态机,并研究了其最优性;它是一个具有输入限制的组合有限状态机,可以处理有限的资源。然后,定义了可重组受限有限状态机,并研究了其最优性;它可以通过对环境变化做出反应来处理不可预测的动态变化的环境。一般来说,局部最优策略不会产生可重组受限有限状态机的全局最优策略,并且在没有未来知识的情况下无法实现全局最优。因此,开发了一种启发式方法,即有限呼吸优先搜索。数值模拟结果表明,启发式方法在适当的参数下表现良好,并且对于可重组受限有限状态机的全局策略/解,局部次优解可以优于局部最优策略。

MSC公司:

93C99号 控制理论中的模型系统

软件:

UMDES公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bellman,R.,《马尔科夫决策过程》,《数学与力学杂志》,6,5,679-684(1957)·Zbl 0078.34101号
[2] Bertsekas,D.P.(2005)。动态编程和最优控制卷I(第三版)。雅典娜科技·邮编1125.90056
[3] Bertsekas,D.P.(2012)。《动态规划与优化控制》第二卷(第三版)。雅典娜科技·Zbl 1298.90001号
[4] Bertsimas,D.和Ryzin,G.V.(1989年)。动态旅行修理工问题。麻省理工学院斯隆管理学院。
[5] Calhoun,G.L.、Draper,M.H.、Abernathy,M.F.、Patzek,M.和Delgado,F.(2005)。用于提高无人机操作员态势感知的合成视觉系统。在SPIE增强和合成视觉中,第219-230页。
[6] Cassandras,C.G.和Lafortune,S.(2007年)。离散事件系统导论(第二版)。斯普林格·Zbl 0934.93001号
[7] Coltin,B.、Veloso,M.和Ventura,R.(2011年)。移动机器人的动态用户任务调度。在AAAI自主移动机器人自动行动规划研讨会上。
[8] Epp,S.S.(2010年)。离散数学及其应用(第四版)。Cengage学习·Zbl 1329.00008号
[9] Ford,D.,《策划一场不可预测的战争:英国情报评估和对日战争》,1937-45年,《战略研究杂志》,27,1,136-167(2007)·doi:10.1080/0140239042000232800
[10] Lee,C.C.,控制系统中的模糊逻辑:模糊逻辑控制器I,IEEE系统、人与控制论汇刊,20,2,404-418(1990)·兹伯利0707.93036 ·doi:10.1109/21.52551
[11] 北卡罗来纳州林奇。;Tuttled,M.R.,《输入/输出自动机简介》,CWI Quarterly,2,3,219-246(1989)·Zbl 0677.68067号
[12] McCarley,J.S.和Wickens,C.D.(2005年)。无人机在国家空域的人为因素影响。技术报告AHFD-05-5/FAA-05-1,伊利诺伊州萨沃伊航空人为因素部。
[13] McMillen,C.和Veloso,M.(2006)。动态环境中机器人团队的分布式、基于游戏的角色分配。在分布式自主机器人系统7中,第1271-1287页·Zbl 1127.68443号
[14] Psaraftis,H.(1988)。动态车辆路径问题。车辆路线:方法和研究。
[15] Puterman,M.L.,马尔可夫决策过程:离散随机动态规划(2014),纽约:John Wiley&Sons,纽约
[16] 拉马奇,P.J。;Wonham,W.H.,一类离散事件过程的监督控制,SIAM控制与优化杂志,25206-230(1987)·Zbl 0618.93033号 ·doi:10.1137/0325013
[17] Seok,J。;费伊德,M。;Girard,A.R.,《不可预测的动态环境巡逻》,《无人系统杂志》,2017年第5期、第4期、第1-14期
[18] Seok,J.、Kabamba,P.T.和Girard,A.R.(2017b)。动态环境下雷达资源管理的任务调度。IET工程杂志。
[19] Smith,S.、Pavone,M.、Bullo,F.和Frazzoli,E.(2008)。具有优先需求的动态旅行修理工。IEEE决策和控制会议,第1206-1211页。
[20] 史密斯,S。;Pavone,M。;布洛,F。;Frazzoli,E.,随机需求优先等级的动态车辆路径,SIAM控制与优化杂志,483224-3245(2010)·Zbl 1205.68435号 ·数字对象标识代码:10.1137/090749347
[21] Thunholm,P.(2005)。时间压力下的计划:试图建立军事战术决策的规范模型。H.Montgomery、R.Lipshitz和B.Brehmer(编辑),《专家如何决策》。
[22] Tumová,J.、Hall,G.、Karaman,S.、Frazzoli,E.和Rus,D.(2013a)。基于安全规则的违反租约控制策略综合。在第16届混合系统国际会议:计算和控制。ACM公司·Zbl 1364.93523号
[23] Tumová,J.、Reyes-Castro,L.I.、Karaman,S.、Frazzoli,E.和Rus,D.(2013b)。规范冲突的最小违反规划。美国控制会议,第200-205页。
[24] Veloso,M.、Biswas,J.、Coltin,B.、Rosenthal,S.、Kollar,T.、Mericli,C.、Samadi,M.,Brandao,S.和Ventura,R.(2012年)。协作机器人:为多层建筑提供服务的协作机器人。在IEEE/RSJ智能机器人和系统国际会议上。
[25] Weber,R.R.,《优化与控制》(1999),剑桥:剑桥大学
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。