托拜厄斯·荣格;路易斯·威亨克尔;达米安·恩斯特;梅斯·弗朗西斯 优化的look-ahead树策略:look-ahead树策略和直接策略搜索之间的桥梁。 (英语) Zbl 1331.93226号 国际期刊改编。控制信号处理。 28,No.3-5,255-289(2014).MSC公司:93E20型 93B40码 90 C59 68T05型 PDF格式BibTeX公司 XML格式引用 \textit{T.Jung}等人,国际期刊Adapt。控制信号处理。28,No.3--5,255-289(2014;Zbl 1331.93226) 全文: DOI程序 arXiv公司 链接
塞巴斯蒂安·布贝克;达米安·恩斯特;奥雷连·加里维尔 概率专家建议的最优发现:有限时间分析和宏观优化。 (英语) Zbl 1305.68140号 J.马赫。学习。物件。 14601-623(2013).MSC公司:68T05型 PDF格式BibTeX公司 XML格式引用 \textit{S.Bubeck}等人,J.Mach。学习。第14号决议,601--623(2013;Zbl 1305.68140) 全文: arXiv公司 链接
拉斐尔·丰特瑙;苏珊·墨菲。;路易斯·威亨克尔;达米安·恩斯特 基于人工轨迹合成的批模式强化学习。 (英语) Zbl 1276.68134号 安·Oper。物件。 208, 383-416 (2013).MSC公司:68T05型 93E35型 PDF格式BibTeX公司 XML格式引用 \textit{R.Fonteneau}等人,Ann.Oper。第208号决议,第383--416号决议(2013年;Zbl 1276.68134) 全文: DOI程序 链接
达米安·恩斯特;皮埃尔·盖尔茨;路易斯·威亨克尔 基于树的批处理模式强化学习。 (英语) Zbl 1222.68193号 J.马赫。学习。物件。 6, 503-556 (2005).MSC公司:68T05型 62H30型 PDF格式BibTeX公司 XML格式引用 \textit{D.Ernst}等人,J.Mach。学习。第6503--556号决议(2005年;Zbl 1222.68193) 全文: 链接