软件搜索-zbMATH Open

人民

swMATH ID:	29437
软件作者：	杨芳凯、吕道明、刘波、史蒂文·古斯塔夫森
描述：	PEORL：集成符号规划和分层强化学习以实现稳健决策。强化学习和符号规划都被用于构建智能自治代理。强化学习依赖于从与现实世界的互动中学习，这通常需要大量的经验。符号规划依赖于人工构建的符号知识，这些知识可能对领域的不确定性和变化不可靠。本文提出了一个统一的框架{em-PEORL}，该框架将符号规划与分层强化学习（HRL）相结合，以处理动态不确定性环境中的决策。符号计划用于指导代理的任务执行和学习，学习的经验反馈给符号知识以改进计划。该方法可以在复杂域中实现快速的策略搜索和稳健的符号计划。该框架在HRL的基准域上进行了测试。
主页：	https://arxiv.org/abs/1804.07779
关键词：	机器学习：arXiv_cs。LG公司；人工智能；arXiv_cs。人工智能；arXiv_状态ML；PEORL框架
相关软件：	REBA公司；BWI罐；资产负债管理；CCalc公司；ModelPlex公司；贝勒罗芬；凯伊迈拉X；Clingcon公司；PDDL公司；数据链路2；DeepProbLog（深度探测日志）；斯莫德尔斯；FODD-计划；博客；克林戈
引用于：	6文件

1出版物描述软件	年份
PEORL：集成符号规划和分层强化学习以实现稳健决策arXiv公司杨芳凯、吕道明、刘波、史蒂文·古斯塔夫森	2018