×

离散时间半马尔可夫随机演化及其应用。 (英语) Zbl 1271.90106号

本文考虑了Banach空间中离散时间半马尔可夫随机演化的一般情况,并研究了其极限理论:平均和扩散近似、关于一点的平衡以及关于由平均极限获得的函数的平衡。介绍了离散时间半马尔可夫随机演化,并导出了它们的哈密尔顿-雅可比-贝尔曼方程。获得了收敛速度和受控进化的结果,并将其应用于可加泛函、几何马尔可夫更新链和由半马尔可夫链驱动的离散时间动力系统。作者的方法是基于鞅表示和基于奇异摄动技术的转移算子的收敛性。

MSC公司:

90立方厘米 马尔可夫和半马尔可夫决策过程
60K37型 随机环境中的进程
60 K15 马尔可夫更新过程,半马尔可夫过程
60磅10英寸 概率测度的收敛性
2017年1月60日 函数极限定理;不变原理
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Aase,K.K.(1988)。当证券价格是Itó过程和随机点过程的组合时,或有索赔估价。斯托克。过程。申请。28 , 185-220. ·Zbl 0645.90009号 ·doi:10.1016/0304-4149(88)90096-8
[2] Adams,R.(1979年)。Sobolev空间。纽约学术出版社·兹比尔0425.46020
[3] Altman,E.和Shwartz,A.(1991年)。马尔可夫决策问题和状态动作频率。SIAM J.控制优化29,786-809·Zbl 0733.90075号 ·数字对象标识代码:10.1137/0329043
[4] Anisimov,V.V.(2008)。排队模型中的切换过程。新泽西州霍博肯市约翰·威利·Zbl 1156.60002号 ·doi:10.1002/9780470611340
[5] Barbu,V.S.和Limnios,N.(2008年)。半马尔可夫链和隐半马尔可夫模型。面向应用(讲义统计.191)。纽约州施普林格·Zbl 1208.60001号 ·doi:10.1007/978-0-387-73173-5
[6] Bertsekas,D.P.和Shreve,S.E.(1996年)。随机最优控制。Athena Scientific,马萨诸塞州贝尔蒙特·Zbl 0471.93002号
[7] Beutler,F.J.和Ross,K.W.(1985年)。带约束受控马尔可夫链的最优策略。数学杂志。分析。申请。112 , 236-252. ·Zbl 0581.93067号 ·doi:10.1016/0022-247X(85)90288-4
[8] Borkar,V.S.(2003)。具有部分观测的遍历控制的动态规划。斯托克。过程。申请。103 , 293-310. ·Zbl 1075.60522号 ·doi:10.1016/S0304-4149(02)00190-4
[9] Boussement,M.和Limnios,N.(2004年)。具有渐近平均故障率约束的马尔可夫决策过程。Commun公司。统计师。理论方法。33 , 1689-1714. ·Zbl 1134.90529号 ·doi:10.1081/STA-120037268
[10] Chiquet,J.、Limnios,N.和Eid,M.(2009年)。分段确定性马尔可夫过程应用于疲劳裂纹扩展建模。J.统计。规划推断。139 , 1657-1667. ·Zbl 1156.62071号 ·doi:10.1016/j.jspi.2008.05.034
[11] Cox,J.C.、Ross,S.A.和Rubinstein,M.(1979年)。期权定价:一种简化方法。《金融经济学杂志》。7 , 229-263. ·兹比尔1131.91333 ·doi:10.1016/0304-405X(79)90015-1
[12] Ethier,S.N.和Kurtz,T.G.(1986年)。马尔可夫过程。约翰·威利,纽约·Zbl 0592.60049号
[13] Fleming,W.H.和Rishel,R.W.(1975年)。确定性和随机最优控制。柏林施普林格·Zbl 0323.49001号
[14] Hersh,R.(1974)。随机演变:对结果和问题的调查。落基山数学杂志。4 , 443-477. ·Zbl 0366.60005号 ·doi:10.1216/RMJ-1974-4-3-443
[15] Jacod,J.和Shiryaev,A.N.(1987年)。随机过程的极限定理。柏林施普林格·Zbl 0635.60021号
[16] Ja sh kiewicz,A.和Nowak,A.S.(2007年)。半马尔可夫控制过程的平均最优性。Morfismos莫尔菲斯莫斯11,15-36。
[17] Keepler,M.(1998)。离散时间马尔可夫链诱导的随机演化过程。葡萄牙。数学。55 , 391-400. ·Zbl 0946.47029号
[18] Koroliuk,V.S.和Limnios,N.(2005年)。合并相空间中的随机系统。新泽西州哈肯萨克,世界科学·Zbl 1101.60003号
[19] Korolyuk,V.S.和Swishchuk,A.(1995年)。随机介质中系统的演化。佛罗里达州博卡拉顿CRC出版社。
[20] Krylov,N.和Bogolyubov,N.(1947年)。非线性力学导论。普林斯顿大学出版社,普林斯顿·Zbl 0063.03382号
[21] Kushner,H.(1971)。随机控制简介。霍尔特、莱茵哈特和温斯顿,纽约·Zbl 0293.93018号
[22] Ledoux,M.和Talangrand,M.(1991)。Banach空间中的概率。柏林施普林格·兹比尔074860004
[23] Limnios,N.(2011年)。离散时间半马尔可夫随机演化——差分方程和加性泛函的平均和扩散近似。Commun公司。统计师。理论方法。40 , 3396-3406. ·Zbl 1315.60039号 ·doi:10.1080/03610926.2011.581160
[24] Limnios,N.和Oprišan,G.(2001年)。半马尔科夫过程与可靠性。Birkhäuser,马萨诸塞州波士顿·Zbl 0990.60004号
[25] Maxwell,M.和Woodroof,M.(2000)。马尔可夫链可加泛函的中心极限定理。Ann.Prob(年检)。28 , 713-724. ·Zbl 1044.60014号 ·doi:10.1214/aop/1019160258
[26] Meyn,S.P.和Tweedie,R.L.(1993年)。马尔可夫链和随机稳定性。斯普林格,伦敦·Zbl 0925.60001号
[27] Nummelin,E.(1984)。一般不可约马氏链与非负算子。剑桥大学出版社·Zbl 0551.60066号
[28] 平斯基,M.A.(1991)。随机进化讲座。新泽西州River Edge,World Scientific·Zbl 0925.60139号
[29] 派克,R.(1961)。马尔可夫更新过程:定义和初步性质。安。数学。统计师。32 , 1231-1242. ·Zbl 0267.60089号 ·doi:10.1214/aoms/1177704863
[30] Pyke,R.(1961年)。有限多状态的马尔可夫更新过程。安。数学。统计师。32 , 1243-1259. ·Zbl 0201.49901号 ·doi:10.1214/aoms/1177704864
[31] Pyke,R.和Schaufele,R.(1964年)。马尔可夫更新过程的极限定理。安。数学。统计师。35 , 1746-1764. ·Zbl 0134.34602号 ·doi:10.1214/aoms/1177700397
[32] Revuz,D.(1975年)。马尔可夫链。荷兰北部,阿姆斯特丹·Zbl 0332.60045号
[33] Rudin,W.(1991)。功能分析。McGraw-Hill,纽约·Zbl 0867.46001号
[34] 舒伦科夫,V.M.(1984)。关于马尔可夫更新理论。理论探索。申请。247-265年·Zbl 0557.60078号
[35] Silvestrov,D.S.(1991)。阵列方案中具有半马尔可夫切换的累积过程的不变性原理。理论探索。申请。36 , 519-535. ·Zbl 0748.60089号
[36] Silvestrov,D.S.(2004)。随机停止随机过程的极限定理。斯普林格,伦敦·Zbl 1057.60021号
[37] Skorokhod,A.V.(1989)。随机微分方程理论中的渐近方法。美国数学学会,普罗维登斯,RI·Zbl 0695.60055号
[38] Skorokhod,A.V.、Hoppenstead,F.C.和Salehi,H.(2002)。随机摄动方法及其在科学和工程中的应用。纽约州施普林格·Zbl 0998.37001号 ·数字对象标识代码:10.1007/b98905
[39] Sobolev,S.L.(1991年)。函数分析在数学物理中的一些应用。美国数学学会,普罗维登斯,RI·Zbl 0732.46001号
[40] Stroock,D.W.和Varadhan,S.R.S.(1979年)。多维扩散过程。柏林施普林格·Zbl 0426.60069号
[41] 斯维里登科,M.N.(1989)。半马尔可夫过程极限定理的鞅方法。理论探索。申请。34 , 540-545. ·Zbl 0705.60077号 ·数字对象标识代码:10.1137/1134065
[42] Swishchuk,A.V.(1995)。随机演化及其应用。多德雷赫特·克鲁沃·Zbl 1171.60380号
[43] Swishchuk,A.和Islam,M.S.(2010年)。几何马尔可夫更新过程及其在金融中的应用。斯托克。分析。申请。第29684-705页·Zbl 1223.60072号 ·网址:10.1080/07362994.2011.581103
[44] Swishchuk,A.和Islam,M.S.(2010年)。几何马尔可夫更新过程的扩散近似和期权价格公式。国际。J.斯托克。分析。2010年,347105,21页·兹比尔1216.60057 ·doi:10.1155/2010/347105
[45] Swishchuk,A.V.和Islam,M.S.(2013)。GMRP的正态偏差和泊松近似。出现在公社。统计师。理论方法·Zbl 1267.60100号
[46] Swishchuk,A.V.和Limnios,N.(2011年)。GMRP的最优停止和欧美期权的定价。程序中。第15届国际。保险大会:数学和经济学(意大利的里雅斯特,2011年6月)。
[47] Swishchuk,A.和Wu,J.(2003)。随机介质中生物系统的演化:极限定理和稳定性。多德雷赫特·克鲁沃·Zbl 1116.60061号
[48] Vega-Amaya,O.和Luque-Vásquez,F.(2000)。Borel空间上半马尔可夫控制过程的样本路径平均成本最优性:无界成本和平均保持时间。申请。数学。27 , 343-367. ·Zbl 1050.90030号
[49] Yin,G.G.和Zhang,Q.(2005)。离散时间马尔可夫链。纽约州施普林格·Zbl 1072.60002号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。