文件Zbl 1382.60094-zbMATH Open

有限马尔可夫链中风险敏感平均成本的折现近似。（英语） Zbl 1382.60094号

数学杂志。分析。申请。 450，第2期，1345-1362（2017）.

摘要：这项工作涉及有限状态空间上的马尔可夫链，该状态空间被赋予代价函数。通过具有恒定风险敏感性的代理观察链的演化，并假设状态空间是一个通信类，研究了风险敏感性折现与平均性能标准之间的关系。证明了当折现因子增加到1时，折现值函数的适当归一化收敛到平均成本。此外，还表明，如果在风险敏感背景下应用风险中性情况下使用的经典归一化，则归一化折现值函数收敛到平均成本的算术平均值。

引用于4文件

MSC公司：

60J10型	马尔可夫链（离散状态空间上的离散时间马尔可夫过程）
60J20型	马尔可夫链和离散时间马尔可夫过程在一般状态空间（社会流动性、学习理论、工业过程等）上的应用

关键词：

指数效用;确定性当量;消失折扣法;Hölder不等式;凸函数

软件：

MC队列

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	阿拉珀塔提斯，A。；博卡尔，V.S。；Fernández-Gaucherand，E。；Ghosh，M.K。；Marcus，S.I.，具有平均成本准则的离散时间受控马尔可夫过程：一项调查，SIAM J.控制优化。，31, 2, 282-334 (1993) ·Zbl 0770.93064号
[2]	Balaji，S。；Meyn，S.P.，不可约马尔可夫链的乘法遍历性和大偏差，随机过程。申请。，90, 1, 123-144 (2000) ·Zbl 1046.60065号
[3]	Bäuerle，北卡罗来纳州。；Rieder，U.，《马尔可夫决策过程及其在金融中的应用》（2011），Springer:Springer New York·Zbl 1236.90004号
[4]	Bäuerle，北卡罗来纳州。；Rieder，U.，《更具风险敏感性的马尔可夫决策过程》，数学。操作。研究，39，1，105-120（2014）·Zbl 1291.90289号
[5]	博卡尔，V.S。；Meyn，S.P.，单调代价马尔可夫决策过程的风险敏感最优控制，数学。操作。192-209年第27号、第1号决议（2002年）·Zbl 1082.90577号
[6]	Cavazos-Cadena，R。；Fernández-Gaucherand，E.，具有风险敏感标准的马尔可夫链中的消失折扣方法，IEEE Trans。自动化。控制，45，10，1800-1816（2000）·Zbl 0990.93136号
[7]	Cavazos-Cadena，R。；Fernández-Gaucherand，E.，通信平均马尔可夫决策链中的风险敏感控制，（Dror，M.；L'Ecuyer，P.；Szidarovsky，F.，《建模不确定性：随机理论、方法和应用的检验》（2002），Kluwer:Kluwer-Boston），525-544
[8]	Chávez-Rodríguez，S。；Cavazos-Cadena，R。；Cruz-Suárez，H.，具有小风险敏感性的马尔可夫决策链中最优平均成本的连续性，数学。方法操作。研究，81，3，269-298（2015）·Zbl 1327.93410号
[9]	Denardo，E.V。；Rothblum，U.G.，风险敏感马尔可夫决策过程的收费公路定理，SIAM J.控制优化。，45, 2, 414-431 (2006) ·Zbl 1151.90571号
[10]	Di Masi，G.B。；Stettner，L.，无限时域离散时间Markov过程的风险敏感控制，SIAM J.控制优化。，38, 1, 61-78 (1999) ·Zbl 0946.93043号
[11]	Di Masi，G.B。；Stettner，L.，小风险离散时间Markov过程的无限时域风险敏感控制，系统控制快报。，40, 15-20 (2000) ·兹比尔0977.93083
[12]	迪马西，G.B。；Stettner，L.，离散时间Markov过程在最小化性质下的无限时域风险敏感控制，SIAM J.控制优化。，46, 1, 231-252 (2007) ·Zbl 1141.93067号
[13]	Hernández-Lerma，O.，自适应马尔可夫控制过程（1989），Springer:Springer纽约·Zbl 0698.90053号
[14]	霍华德·R·A。；Matheson，J.E.，风险敏感马尔可夫决策过程，管理。科学。，18, 7, 356-369 (1972) ·Zbl 0238.90007号
[15]	Ja sh kiewicz，A.，具有一般状态空间的风险敏感控制的平均最优性，Ann.Appl。概率。，17, 2, 654-675 (2007) ·Zbl 1128.93056号
[16]	康托伊亚尼斯，I。；Meyn，S.P.，几何遍历Markov过程的谱理论和极限定理，Ann.Appl。概率。，13, 1, 304-362 (2003) ·Zbl 1016.60066号
[17]	Pitera，M。；Stettner，L.，《具有一般因素的长期风险敏感投资组合》，数学。方法操作。研究，82，2，265-293（2016）·Zbl 1341.93109号
[18]	Puterman，M.L.，《马尔可夫决策过程：离散随机动态规划》（1994），威利出版社，纽约·Zbl 0829.90134号
[19]	Roussas，G.G.，《数理统计课程》（1997），学术出版社：纽约学术出版社·Zbl 0921.62001号
[20]	沈毅。；斯坦纳特·W。；Obermayer，K.，风险敏感马尔可夫控制过程，SIAM J.control Optim。，51, 5, 3652-3672 (2013) ·Zbl 1287.60085号
[21]	Sladkí，K.，风险敏感马尔可夫决策链中的增长率和平均最优性，Kybernetika，44，2，205-226（2008）·Zbl 1154.90612号
[22]	Stettner，L.，风险敏感投资组合优化，数学。方法操作。决议，50，3463-474（1999）·Zbl 0949.93077号
[23]	Tijms，H.C.，《随机模型第一课程》（2003），威利出版社：威利纽约·Zbl 1088.60002号

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
拉	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

有限马尔可夫链中风险敏感平均成本的折现近似。（英语） Zbl 1382.60094号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

有限马尔可夫链中风险敏感平均成本的折现近似。 （英语） Zbl 1382.60094号

MSC公司：

关键词：

软件：

参考文献：

有限马尔可夫链中风险敏感平均成本的折现近似。（英语） Zbl 1382.60094号