“深度离线RL中隐式正则化的实证研究。”
圣格雷 , 斯利瓦桑·斯里尼瓦桑 , 雅库布·辛格诺夫斯基 , 乔治·奥斯特罗夫斯基 , Mehrdad Farajtabar公司 , 马修霍夫曼 , 拉兹万·帕斯卡努 , 阿诺·杜塞特 :
深度离线RL中隐式正则化的实证研究。 事务处理。 机器。 学习。 物件。 2022 ( 2022 )
由于引用数据不可用,以下列表可能不完整, 引用字符串可能未成功映射到dblp中列出的项,并且 我们没有针对这些列表中给出的所有项目的完整和精心策划的元数据。