大卫·马丁内斯;阿莱尼·吉勒姆;托尼·里贝罗;井上,胜美;卡梅·托拉斯 针对具有外生效应的计划的关系强化学习。 (英语) Zbl 1434.68432号 J.马赫。学习。物件。 18(2017-2018),第78号论文,44页(2017).MSC公司:68T05型 68N17号 68T20型 68T40型 PDF格式BibTeX公司 XML格式引用 \textit{D.Martínez}等人,J.Mach。学习。第18号决议,第78号论文,44页(2017年;Zbl 1434.68432) 全文: 链接
大卫·马丁内斯;阿莱尼·吉勒姆;卡梅·托拉斯 通过引导演示进行关系强化学习。 (英语) Zbl 1420.68170号 Artif公司。智力。 247, 295-312 (2017).MSC公司:68T05型 68T40型 PDF格式BibTeX公司 XML格式引用 \textit{D.Martínez}等人,Artif。智力。247295-312(2017年;兹比尔1420.68170) 全文: 内政部
大卫·马丁内斯;托尼·里贝罗;井上,胜美;阿莱尼·吉勒姆;卡梅·托拉斯 从解释转换中学习概率动作模型。 (英语) Zbl 1407.68407号 De Vos,Marina(编辑)等人,第31届逻辑编程国际会议的技术交流,2015年ICLP,爱尔兰科克,2015年8月31日至9月4日。亚琛:亚琛公路。CEUR研讨会程序。143314页(2015年)。MSC公司:68T05型 68N17号 PDF格式BibTeX公司 XML格式引用 \textit{D.Martínez}等人,CEUR Workshop Proc。1433,14页(2015;Zbl 1407.68407) 全文: 链接