MDP工具箱:马尔可夫决策过程工具箱
Markov决策过程(MDP)工具箱提出了与离散时间Markov决策进程的分解相关的函数:有限时域、值迭代、策略迭代、带有一些变量的线性规划算法,并提出了一些与强化学习相关的函数。
版本: |
4.0.3 |
取决于: |
矩阵,线性规划问题 |
出版: |
2017-03-03 |
作者: |
伊丹·查德斯、纪尧姆·查普伦、玛丽·乔西·克罗斯、弗雷德里克·加西亚、里吉斯·萨巴丁 |
维护人员: |
纪尧姆·查普伦(Guillaume Chapron)<嘉年华环保组织(carnitoreconservation.org)的gchapron |
许可证: |
BSD_3_条款+文件许可证 |
需要编译: |
不 |
CRAN检查: |
MDP工具箱结果 |
文件:
下载内容:
链接:
请使用规范形式https://CRAN.R-project.org/package=MDP工具箱链接到此页面。