×

Markov-Entscheidungs-Prozesse mit abhängigen Aktionen für optimize Reparaturmaßnahmen bei unvollständiger信息。(不完全信息下最优修复策略的具有相依行为的马尔可夫决策过程)。 (德语) Zbl 0757.90027号

摘要:对于具有模块化结构的技术系统,在系统状态信息不完全的情况下计算最优维护策略将导致“具有相关动作”的马尔可夫决策过程。针对这一过程,开发了一种分枝定界算法。

MSC公司:

90B25型 运筹学中的可靠性、可用性、维护和检查
90-08 运筹学和数学规划相关问题的计算方法
90立方厘米 马尔可夫和半马尔可夫决策过程
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bertsekas DP(1987)动态规划、确定性和随机模型。新泽西州恩格尔伍德悬崖普伦蒂斯·霍尔
[2] Cinlar E(1975)随机过程导论。新泽西州恩格尔伍德悬崖普伦蒂斯·霍尔·Zbl 0341.60019号
[3] Denardo,EV(1982)《动态规划、模型和应用》。新泽西州恩格尔伍德悬崖普伦蒂斯·霍尔
[4] Dynkin EB,Yushkevich AA(1979)受控马尔可夫过程。施普林格,柏林-海德堡-纽约
[5] Gaede K-W(1986)《Reparaturmaßnahmen bei unterschiedlichem Informations stand》。Z angew数学力学66(5):T346-T347
[6] Hinderer K(1970)离散时间参数非平稳动态规划基础。施普林格,柏林-海德堡-纽约·Zbl 0202.18401号
[7] Howard RA(1960)动态规划和马尔可夫过程。麻省理工学院出版社,马萨诸塞州剑桥·Zbl 0091.16001号
[8] Lovejoy WS(1991)部分观测马尔可夫决策过程的算法方法调查。《运营年鉴》28:47–65·Zbl 0717.90086号 ·doi:10.1007/BF02055574
[9] Monahan GE(1982)部分可观测马尔可夫决策过程综述:理论、模型和算法。管理科学28:1–16·Zbl 0486.90084号 ·doi:10.1287/mnsc.28.1.1
[10] Schneeberger S(1988)《Optimale Instandhaltung für Systeme mit modulem Aufbau bei unvollständiger Information》。慕尼黑理工大学论文·Zbl 0674.90040号
[11] Seneta E(1980)非负矩阵和马尔可夫链。施普林格,纽约-海德堡-柏林·Zbl 0484.65086号
[12] Smallwood R,Sondik E(1973)有限水平上部分可观测马尔可夫过程的最优控制。运营研究21:1071–1088·Zbl 0275.93059号 ·doi:10.1287/opre.21.5.1071
[13] Sondik E(1978)无限视野中部分可观测马尔可夫过程的最优控制:折现成本。运营研究26:282–304·Zbl 0379.60067号 ·doi:10.1287/opre.26.282
[14] White CC(1991)部分可观测马尔可夫决策过程的求解技术综述。《Ann Oper Res》32:215–230·Zbl 0727.90089号 ·doi:10.1007/BF02204836
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。