摘要

在动态决策问题中,在最大化预期回报和最小化风险之间找到适当的平衡是一项挑战。在本文中,我们考虑有限时间范围的马尔可夫决策过程中的NP硬均方差(MV)优化问题。我们提出了一种求解MV问题的启发式方法,该方法基于状态相关风险规避和高效的动态规划技术。我们的方法也可以应用于均值-方差(MSV)问题,尤其关注下行风险。我们证明了我们的启发式算法在动态定价应用中的适用性和有效性。使用可重复的示例,我们表明我们的方法在解决MV和MSV问题方面优于现有的最先进的基准模型,同时还提供了具有竞争力的运行时。此外,与基于恒定风险水平的模型相比,我们发现,在销售流程偏离其计划路径的情况下,州依赖风险规避可以更有效地进行干预。我们的概念与领域无关,易于实现,计算复杂度低。

本文根据牛津大学出版社标准期刊出版模式的条款出版和发行(https://academic.oup.com/journals/pages/open_access/funder_policies/chorus/standard_publication_model)
您当前没有访问此文章的权限。