Heuristic mean-variance optimization in Markov decision processes using state-dependent risk aversion

Schlosser, Rainer

doi:10.1093/imaman/dpab009

摘要

在动态决策问题中，在最大化预期回报和最小化风险之间找到适当的平衡是一项挑战。在本文中，我们考虑有限时间范围的马尔可夫决策过程中的NP硬均方差（MV）优化问题。我们提出了一种求解MV问题的启发式方法，该方法基于状态相关风险规避和高效的动态规划技术。我们的方法也可以应用于均值-方差（MSV）问题，尤其关注下行风险。我们证明了我们的启发式算法在动态定价应用中的适用性和有效性。使用可重复的示例，我们表明我们的方法在解决MV和MSV问题方面优于现有的最先进的基准模型，同时还提供了具有竞争力的运行时。此外，与基于恒定风险水平的模型相比，我们发现，在销售流程偏离其计划路径的情况下，州依赖风险规避可以更有效地进行干预。我们的概念与领域无关，易于实现，计算复杂度低。

本文根据牛津大学出版社标准期刊出版模式的条款出版和发行(https://academic.oup.com/journals/pages/open_access/funder_policies/chorus/standard_publication_model)

您当前没有访问此文章的权限。

下载所有幻灯片

月份：	总浏览次数：
2021年5月	12
2021年6月	11
2021年7月	2
2021年8月	4
2021年9月	三
2021年10月	8
2021年11月	三
2022年1月	17
2022年2月	16
2022年3月	15
2022年4月	11
2022年5月	15
2022年6月	2
2022年7月	7
2022年8月	10
2022年9月	6
2022年10月	5
2022年11月	2
2022年12月	4
2023年1月	14
2023年2月	4
2023年3月	6
2023年4月	4
2023年5月	2
2023年6月	1
2023年7月	三
2023年8月	7
2023年10月	三
2023年11月	三
2023年12月	1
2024年1月	1
2024年3月	1
2024年4月	1

基于状态相关风险规避的马尔可夫决策过程启发式均值-方差优化

摘要

引文

意见

海拔高度

电子邮件警报

通过引用文章

最新的

阅读次数最多

被引用次数最多

基于状态相关风险规避的马尔可夫决策过程启发式均值-方差优化

摘要

登录

数学及其应用研究所成员

个人账户

机构准入

机构账户管理

获取访问帮助

机构准入

基于IP的访问

通过您的机构登录

使用图书卡登录

协会成员

通过社交网站登录

使用个人帐户登录

个人账户

查看您的登录帐户

已登录但无法访问内容