Róbert Busa-Fekete等人:基于偏好的强化学习:使用基于偏好的竞赛算法的进化直接策略搜索。(2014) 期刊/ml/Busa-FeketeSWCH14 2007年10月10日/S10994-014-5458-8 问题115146321 基于偏好的强化学习:使用基于偏好的竞赛算法进行进化直接策略搜索。 5 罗贝特·布萨·费科特 1 Balázs Szörényi 2 保罗·翁 程伟伟(Weiwei Cheng) 4 埃克·Hüllermier 5 327-351 机器。学习。 机器。学习。 97 2014 dblp记录“journals/ml/Busa-FeketeSWCH14”的RDF数据的来源信息 2023-08-28T21:35:33+0200