“基于偏好的强化学习:进化直接策略搜索……”
罗贝特·布萨·费科特 , Balázs Szörényi , 保罗·翁 , 程伟伟(Weiwei Cheng) , 埃克·Hüllermier :
基于偏好的强化学习:使用基于偏好的竞赛算法进行进化直接策略搜索。 机器。 学习。 97 ( 三 ) : 327-351 ( 2014 )
由于引用数据不可用,以下列表可能不完整, 引用字符串可能未成功映射到dblp中列出的项,并且 我们没有针对这些列表中给出的所有项目的完整和精心策划的元数据。