×

有限马尔可夫链中风险敏感平均成本的折现近似。 (英语) Zbl 1382.60094号

摘要:这项工作涉及有限状态空间上的马尔可夫链,该状态空间被赋予代价函数。通过具有恒定风险敏感性的代理观察链的演化,并假设状态空间是一个通信类,研究了风险敏感性折现与平均性能标准之间的关系。证明了当折现因子增加到1时,折现值函数的适当归一化收敛到平均成本。此外,还表明,如果在风险敏感背景下应用风险中性情况下使用的经典归一化,则归一化折现值函数收敛到平均成本的算术平均值。

MSC公司:

60J10型 马尔可夫链(离散状态空间上的离散时间马尔可夫过程)
60J20型 马尔可夫链和离散时间马尔可夫过程在一般状态空间(社会流动性、学习理论、工业过程等)上的应用

软件:

MC队列
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿拉珀塔提斯,A。;博卡尔,V.S。;Fernández-Gaucherand,E。;Ghosh,M.K。;Marcus,S.I.,具有平均成本准则的离散时间受控马尔可夫过程:一项调查,SIAM J.控制优化。,31, 2, 282-334 (1993) ·Zbl 0770.93064号
[2] Balaji,S。;Meyn,S.P.,不可约马尔可夫链的乘法遍历性和大偏差,随机过程。申请。,90, 1, 123-144 (2000) ·Zbl 1046.60065号
[3] Bäuerle,北卡罗来纳州。;Rieder,U.,《马尔可夫决策过程及其在金融中的应用》(2011),Springer:Springer New York·Zbl 1236.90004号
[4] Bäuerle,北卡罗来纳州。;Rieder,U.,《更具风险敏感性的马尔可夫决策过程》,数学。操作。研究,39,1,105-120(2014)·Zbl 1291.90289号
[5] 博卡尔,V.S。;Meyn,S.P.,单调代价马尔可夫决策过程的风险敏感最优控制,数学。操作。192-209年第27号、第1号决议(2002年)·Zbl 1082.90577号
[6] Cavazos-Cadena,R。;Fernández-Gaucherand,E.,具有风险敏感标准的马尔可夫链中的消失折扣方法,IEEE Trans。自动化。控制,45,10,1800-1816(2000)·Zbl 0990.93136号
[7] Cavazos-Cadena,R。;Fernández-Gaucherand,E.,通信平均马尔可夫决策链中的风险敏感控制,(Dror,M.;L'Ecuyer,P.;Szidarovsky,F.,《建模不确定性:随机理论、方法和应用的检验》(2002),Kluwer:Kluwer-Boston),525-544
[8] Chávez-Rodríguez,S。;Cavazos-Cadena,R。;Cruz-Suárez,H.,具有小风险敏感性的马尔可夫决策链中最优平均成本的连续性,数学。方法操作。研究,81,3,269-298(2015)·Zbl 1327.93410号
[9] Denardo,E.V。;Rothblum,U.G.,风险敏感马尔可夫决策过程的收费公路定理,SIAM J.控制优化。,45, 2, 414-431 (2006) ·Zbl 1151.90571号
[10] Di Masi,G.B。;Stettner,L.,无限时域离散时间Markov过程的风险敏感控制,SIAM J.控制优化。,38, 1, 61-78 (1999) ·Zbl 0946.93043号
[11] Di Masi,G.B。;Stettner,L.,小风险离散时间Markov过程的无限时域风险敏感控制,系统控制快报。,40, 15-20 (2000) ·兹比尔0977.93083
[12] 迪马西,G.B。;Stettner,L.,离散时间Markov过程在最小化性质下的无限时域风险敏感控制,SIAM J.控制优化。,46, 1, 231-252 (2007) ·Zbl 1141.93067号
[13] Hernández-Lerma,O.,自适应马尔可夫控制过程(1989),Springer:Springer纽约·Zbl 0698.90053号
[14] 霍华德·R·A。;Matheson,J.E.,风险敏感马尔可夫决策过程,管理。科学。,18, 7, 356-369 (1972) ·Zbl 0238.90007号
[15] Ja sh kiewicz,A.,具有一般状态空间的风险敏感控制的平均最优性,Ann.Appl。概率。,17, 2, 654-675 (2007) ·Zbl 1128.93056号
[16] 康托伊亚尼斯,I。;Meyn,S.P.,几何遍历Markov过程的谱理论和极限定理,Ann.Appl。概率。,13, 1, 304-362 (2003) ·Zbl 1016.60066号
[17] Pitera,M。;Stettner,L.,《具有一般因素的长期风险敏感投资组合》,数学。方法操作。研究,82,2,265-293(2016)·Zbl 1341.93109号
[18] Puterman,M.L.,《马尔可夫决策过程:离散随机动态规划》(1994),威利出版社,纽约·Zbl 0829.90134号
[19] Roussas,G.G.,《数理统计课程》(1997),学术出版社:纽约学术出版社·Zbl 0921.62001号
[20] 沈毅。;斯坦纳特·W。;Obermayer,K.,风险敏感马尔可夫控制过程,SIAM J.control Optim。,51, 5, 3652-3672 (2013) ·Zbl 1287.60085号
[21] Sladkí,K.,风险敏感马尔可夫决策链中的增长率和平均最优性,Kybernetika,44,2,205-226(2008)·Zbl 1154.90612号
[22] Stettner,L.,风险敏感投资组合优化,数学。方法操作。决议,50,3463-474(1999)·Zbl 0949.93077号
[23] Tijms,H.C.,《随机模型第一课程》(2003),威利出版社:威利纽约·Zbl 1088.60002号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。