rcss系统 R包rcss:凸开关系统。有限时间受控马尔可夫链在有限时间受控状态下的马尔可夫链控制问题的演化。假定奖赏函数在连续状态下是凸的和Lipschitz连续的。作用集是有限的。 此软件的关键字 这里的任何内容都将在支持canvas元素的浏览器上被替换 动态规划 二元性 随机控制 马尔科夫决策 自然资源开采 决策优化 近似动态规划 对偶方法 实物期权 最优控制 命令清算 局部观察 马尔可夫决策过程 最佳切换 zbMATH中的参考文献(参考,1标准件) 显示结果1到3,共3个。 是的按年份排序(引用) 10 20 50 全部的 Hinz,Juri;Tarnopolskaya,Tanya;Yee,Jeremy:采矿作业决策优化的路径动态规划有效算法(2020) Hinz,Juri;Yee,Jeremy:最优资产清算问题的算法方法(2017) Hinz,Juri;Yee,Jeremy:部分可观测动态的随机切换与最优资产配置(2017)