@第{zbMATH07306868条,作者={卡卢斯、内森和尤哈拉、马萨托什},Title={双强化学习用于{Markov}决策过程中有效的非策略评估},FJournal={机器学习研究杂志(JMLR)},期刊={J.Mach.Learn.Res.},ISSN={1532-4435},体积={21},页码={63},注={Id/No 167},年份={2020年},语言={英语},关键词={68T05,90C40,90C90},URL={jmlr.csail.mit.edu/papers/v21/19-827.html},zbMATH={7306868},Zbl={1525.68113}}