×

具有噪声延迟信息的随机行走的控制。 (英语) Zbl 0877.93136号

摘要:我们考虑非负整数上随机游动的控制。控制器有两个动作。它基于当前状态的噪声信息,但基于先前状态和操作的完整信息来做出决策。我们建立了阈值策略的最优性,其中阈值取决于最后的操作和噪声信息。我们将结果应用于流和服务控制问题。

理学硕士:

93E20型 最优随机控制
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 奥尔特曼,E。;Koole,G.,具有马尔可夫决策到达过程的随机调度博弈,J.Compute。数学。申请。,26, 6, 141-148 (1993) ·兹比尔0793.90020
[2] 奥尔特曼,E。;Nain,P.,具有延迟信息的闭环控制,性能评估。第20版,193-204(1992)
[3] E.Altman和S.Stidham,Jr.,二行动马尔可夫决策过程中最优策略的单调性,及其在排队网络中的应用。;E.Altman和S.Stidham,Jr.,准备中的二行动马尔可夫决策过程中最优策略的单调性,以及队列网络的应用。
[4] D.Artiges,最佳路由到两个具有延迟信息的异构服务站,出现在:IEEE传输。自动化。控制; D.Artiges,具有延迟信息的两个异构服务站的最佳路由,出现在:IEEE传输。自动化。控制·Zbl 0832.90039号
[5] Hernández-Lerma,O.,自适应马尔可夫控制过程(1989),Springer:Springer纽约·Zbl 0698.90053号
[6] Hsu,K。;Marcus,S.I.,有限状态Markov过程的分散控制,IEEE Trans。自动化。控制,AC-27,426-431(1982)·Zbl 0492.93071号
[7] Koole,G.,两种维修模型中的最优维修人员分配,这两种模型相当于具有早期决策的路线模型,(技术报告BS-R9301(1993),CWI:CWI阿姆斯特丹)
[8] Kuri,J。;Kumar,A.,《具有延迟队列长度信息的到达队列的最优控制》,(第31届IEEE CDC会议录,第31届美国亚利桑那州IEEE CDD会议录(1992年)),997-998
[9] Ross,S.M.,《随机过程》(1983),威利出版社:威利纽约·Zbl 0555.60002号
[10] Schoute,F.C.,《分组交换卫星通信中的分散控制》,IEEE Trans。自动化。控制,AC-23362-371(1978)·Zbl 0377.49005号
[11] Stidham,S.,排队系统准入的最优控制,IEEE Trans。自动化。控制,AC-30,705-713(1985)·Zbl 0563.90044号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。