李三江;龙志国;刘伟明;马特·杜卡姆;都是,艾伦 冗余拓扑约束。 (英语) Zbl 1343.68234号 Artif公司。智力。 225,51-76(2015).MSC公司:68立方英尺 PDF格式BibTeX公司 XML格式引用 \textit{S.Li}等人,Artif。智力。225、51-76(2015;Zbl 1343.68234) 全文: 内政部 arXiv公司
诺克斯·W·布拉德利;彼得·斯通 从人类奖励中构建强化学习:奖励积极性、时间折扣、偶然性和绩效。 (英语) Zbl 1343.68199号 Artif公司。智力。 225, 24-50 (2015).MSC公司:68T05型 PDF格式BibTeX公司 XML格式引用 \textit{W.B.Knox}和\textit{P.Stone},人工制品。智力。225,24-50(2015;Zbl 1343.68199) 全文: 内政部
尼科拉斯·里维拉;Jorge A.Baier。;卡洛斯·埃尔南德斯 将权重纳入实时启发式搜索。 (英语) Zbl 1344.68219号 Artif公司。智力。 225, 1-23 (2015).MSC公司:68T20型 PDF格式BibTeX公司 XML格式引用 \textit{N.Rivera}等人,Artif。智力。225,1-23(2015;Zbl 1344.68219) 全文: 内政部