克莱门特·格林
人员信息
优化列表
2020年–今天
2024 [i6] 天威倪 , 本杰明·艾森巴赫 , 埃尔凡·塞耶德萨利希 , 米歇尔·马 , 克莱门·盖林 , 阿迪蒂亚·马哈扬 , Pierre-Luc培根 :
桥接状态和历史表示:理解自我预测RL。 CoRR公司 abs/2401.08898 ( 2024 ) [i5] 米歇尔·马 , 倪天伟 , 克莱门特·格林 , 皮埃尔卢卡·多罗 , Pierre-Luc培根 :
变形金刚世界模型能提供更好的政策梯度吗? CoRR公司 abs/2402.05290 ( 2024 ) 2023 [i4] 马汉·法蒂 , 克莱门·盖林 , 乔纳森·皮洛 , 大卫·卡纳 , Pierre-Luc培根 , 罗斯·戈罗欣(Ross Goroshin) :
课程修正科普曼陈述。 CoRR公司 abs/2310.15386 ( 2023 ) 2022 【c7】 克莱门·盖林 , 浅井正太郎 , 罗汉·奇尼斯 , 席尔沃 , Leslie Pack Kaelbling公司 , 希林·索拉比 , 迈克尔·卡茨 :
经典规划的强化学习:将启发式视为密集的奖励生成器。 ICAPS公司 2022 : 588-596 2021 【c6】 靖宇 , 克莱门·盖林 , 弗洛里安·施费尔 , 阿南德库玛(Animashere Anandkumar) :
鲁棒强化学习:一种受约束的博弈论方法。 L4DC(L4DC) 2021 : 1242-1254 【c5】 克莱门特·格林 , 川口贤治 , 黄娇阳 , Leslie Pack Kaelbling公司 :
将基于端到端模型的强化学习方法理解为隐含参数化。 NeurIPS公司 2021 : 703-714 [i3] 克莱门·盖林 , 浅井正太郎 , 罗汉·奇尼斯 , 席尔沃 , Leslie Pack Kaelbling公司 , 希林·索拉比 , 迈克尔·卡茨 :
经典规划的强化学习:将启发式视为密集的奖励生成器。 CoRR公司 abs/2109.14830 ( 2021 )
2010 – 2019
2018 【c4】 子王 , 克莱门·盖林 , Pushmet Kohli公司 , 斯蒂芬妮·杰格尔卡 :
高维空间中的成批大尺度贝叶斯优化。 AISTATS公司 2018 : 745-754 【c3】 克莱门·盖林 , Leslie Pack Kaelbling公司 , 托马斯·洛扎诺·佩雷斯 :
使用压缩线性动作模型进行适应性重新规划,以便从演示中学习。 CoRL公司 2018 : 432-442 2017 [i2] 子王 , 克莱门·盖林 , Pushmet Kohli公司 , 斯蒂芬妮·杰格尔卡 :
高维空间中的成批大尺度贝叶斯优化。 CoRR公司 abs/1706.01445 ( 2017 ) 2016 【c2】 克莱门·盖林 , 潘阳晨 , 马莎怀特 :
增量截断LSTD。 国际JCAI 2016 : 1505-1511 2015 [i1] 克莱门·盖林 , 马莎怀特 :
增量截断LSTD。 CoRR公司 abs/1511.08495 ( 2015 ) 2013 【c1】 克莱门·盖林 , Doina Precup公司 :
利用绝对时差误差进行强化学习的智能探索。 美国原子能机构 2013 : 1037-1044