×

人民

swMATH ID: 29437
软件作者: 杨芳凯、吕道明、刘波、史蒂文·古斯塔夫森
描述: PEORL:集成符号规划和分层强化学习以实现稳健决策。强化学习和符号规划都被用于构建智能自治代理。强化学习依赖于从与现实世界的互动中学习,这通常需要大量的经验。符号规划依赖于人工构建的符号知识,这些知识可能对领域的不确定性和变化不可靠。本文提出了一个统一的框架{em-PEORL},该框架将符号规划与分层强化学习(HRL)相结合,以处理动态不确定性环境中的决策。符号计划用于指导代理的任务执行和学习,学习的经验反馈给符号知识以改进计划。该方法可以在复杂域中实现快速的策略搜索和稳健的符号计划。该框架在HRL的基准域上进行了测试。
主页: https://arxiv.org/abs/1804.07779
关键词: 机器学习:arXiv_cs。LG公司人工智能arXiv_cs。人工智能arXiv_状态MLPEORL框架
相关软件: REBA公司BWI罐资产负债管理CCalc公司ModelPlex公司贝勒罗芬凯伊迈拉XClingcon公司PDDL公司数据链路2DeepProbLog(深度探测日志)斯莫德尔斯FODD-计划博客克林戈
引用于: 6文件

标准条款

1出版物描述软件 年份
PEORL:集成符号规划和分层强化学习以实现稳健决策arXiv公司
杨芳凯、吕道明、刘波、史蒂文·古斯塔夫森
2018

按年份列出的引文