×

自动归纳Bellman-error特征,用于概率规划。 (英文) Zbl 1344.68193号

总结:特定领域的特征在表示整个机器学习和决策理论规划中的问题结构方面非常重要。在规划中,一旦提供了状态特征,诸如近似值迭代之类的领域独立算法就可以学习那些特征的加权组合,这些特征通常表现得很好,可以作为状态值(例如,到目标的距离)的启发式估计。在现实世界中成功的应用程序通常需要人工专家精心设计的功能。在这里,我们提出了在很少或没有人工干预的情况下学习有用的特定领域特征集的自动过程。我们的方法选择并添加了描述近似值迭代期间Bellman方程中高度不一致的状态空间区域(状态Bellman误差)的特征。我们的方法可以使用任何实值特征假设空间和相应的学习方法从状态值对的训练集中选择特征。我们使用关系和命题特征语言定义的假设空间,使用九个概率规划域来评估该方法。我们表明,使用关系特征空间的近似值迭代在域相关随机关系规划中具有最先进的性能。我们的方法提供了第一种成功玩俄罗斯方块的域依赖方法(没有人机工程学特性)。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68T20型 人工智能背景下的问题解决(启发式、搜索策略等)

软件:

氟氯化钙
PDF格式BibTeX公司 XML格式引用