×

概率扭曲的风险敏感无限小时动态规划。 (英语) Zbl 1420.91074号

总结:从历史上看,风险敏感标准的研究重点是其规范应用,即应该做什么。经典的例子是产生确定性策略的预期效用函数。最近,有关动态一致性风险度量的文献拓宽了风险敏感绩效评估的选择范围。然而,一致的风险度量必须是凸的。本文提出了预期效用和一致风险度量方法的替代方法。这种受累积前景理论(CPT)启发的新方法是非凸的,并且有大量的经验证据支持其对人类决策的描述能力,即实际所做的事情。基于CPT的方法的一个关键独特特征是概率失真,这对于建模人类决策至关重要。因此,在建模人类决策时,应使用CPT而不是预期效用和连贯风险度量,这需要比以往工作更高的表达水平。此外,尽管连贯风险度量和CPT都产生随机策略,CPT对系统的不准确概率描述更为稳健,它生成的策略与一致风险度量的策略有显著不同。

MSC公司:

91B16号 效用理论
91B06型 决策理论
90立方厘米 动态编程
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿尔茨纳,P。;Delbaen,F。;埃伯,J.-M。;Heath,D.,《一致风险度量》,《数学金融》,第9、3、203-228页(1999年)·Zbl 0980.91042号
[2] Bellman,R.,《论动态规划理论》,《美国国家科学院院刊》,第38、8、716-719页(1952年),PMID:16589166,PMCID:PMC1063639·Zbl 0047.13802号
[3] Bertsekas,D.P.,抽象动态编程(2013),雅典娜科学:雅典娜科技贝尔蒙特,马萨诸塞州·Zbl 1312.90086号
[4] 圣阿武什,O。;Ruszczyñski,A.,未贴现瞬态马尔可夫模型的风险规避控制,SIAM优化杂志,52,6,3935-3966(2014)·Zbl 1311.93087号
[5] 切里迪托,P。;Delbaen,F。;Kupper,M.,有界cádlág过程的相干和凸货币风险度量,随机过程及其应用,112,1,1-22(2004)·兹比尔1114.91047
[6] Delbaen,F。;Hochschule,E.T.,一般概率空间上的相干风险度量,(dieter sondermann(2002)论文,Springer),1-37·Zbl 1020.91032号
[7] Föllmer,H.和Schied,A.(2008)。凸性和一致性风险度量。;Föllmer,H.和Schied,A.(2008)。凸性和一致性风险度量。
[8] 何,X.D。;周晓云,通过分位数进行投资组合选择,《数学金融》,2011年第21、2、203-231页·兹比尔1229.91291
[9] Kahneman,D.和Tversky,A.(1979年)。前景理论:风险下的决策分析。国家应急培训中心。;Kahneman,D.和Tversky,A.(1979年)。前景理论:风险下的决策分析。国家应急培训中心·Zbl 0411.90012号
[10] Lin,K.,《具有累积前景理论的随机系统》(2013),马里兰大学(博士论文)
[11] Lin,K.和Marcus,S.I.(2013)。具有非凸风险敏感度量的动态规划。美国控制会议; Lin,K.和Marcus,S.I.(2013)。具有非凸风险敏感度量的动态规划。美国控制会议
[12] Riedel,F.,动态一致风险度量,随机过程及其应用,112,2185-200(2004)·Zbl 1114.91055号
[13] Ruszczyñski,A.,马尔可夫决策过程的风险规避动态规划,数学规划,125,2,235-261(2010)·Zbl 1207.49032号
[14] Ruszczynski,A。;Shapiro,A.,条件风险映射,运筹学,31,3544-561(2006)·Zbl 1278.90284号
[15] A.特维斯基。;Kahneman,D.,《前景理论的进展:不确定性的累积表示》,《风险与不确定性杂志》,5,4,297-323(1992)·兹比尔0775.90106
[16] Wakker,P.P.,《前景理论:风险和模糊性》(2010),剑桥大学出版社·Zbl 1200.91004号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。