埃布尔
人员信息
其他同名人员
优化列表
2020年–今天
2024 【i21】 彭安迪(Andi Peng) , 孙玉英 , 舒天敏 , 埃布尔 :
语用特征偏好:从人类输入中学习与回报相关的偏好。 CoRR公司 abs/2405.14769 ( 2024 ) 2023 【c23】 迈克尔·鲍林 , 约翰·D·马丁 , 埃布尔 , 威尔·达布尼 :
解决报酬假说。 ICML公司 2023 : 3003-3020 [公元22年] 埃布尔 , 安德烈·巴雷托 , 本杰明·范罗伊 , Doina Precup公司 , 哈多·菲利普·范·哈塞尔特 , 萨汀德·辛格 :
持续强化学习的定义。 NeurIPS公司 2023 [i20] 埃布尔 , 安德烈·巴雷托 , 哈多·范·哈塞尔特 , 本杰明·范·罗伊 , Doina Precup公司 , 萨廷德·辛格 :
关于有界代理的收敛性。 CoRR公司 abs/2307.11044 ( 2023 ) [i19] 埃布尔 , 安德烈·巴雷托 , 本杰明·范罗伊 , Doina Precup公司 , 哈多·范·哈塞尔特 , 萨汀德·辛格 :
持续强化学习的定义。 CoRR公司 abs/2307.11046 ( 2023 ) 2022 【c21】 杰琳娜·卢凯蒂娜 , 塞巴斯蒂安·弗伦内尔哈格 , 扬尼克·施罗德克 , 埃布尔 , 汤姆·扎哈维 , 萨廷德·辛格 :
非稳态环境中的超梯度。 科拉斯 2022 : 886-901 [公元20年] 埃布尔 , 威尔·达布尼 , 安娜·哈里顿扬(Anna Harutyunyan) , 马克·K·何 , 迈克尔·利特曼 , Doina Precup公司 , 萨汀德·辛格 :
马尔可夫报酬的表示(扩展抽象)。 国际JCAI 2022 : 5254-5258 [i18] 埃布尔 :
强化学习中的抽象理论。 CoRR公司 abs/2203.00397 ( 2022 ) [i17] 杰琳娜·卢凯蒂娜 , 塞巴斯蒂安·弗伦内尔哈格 , 扬尼克·施罗克 , 埃布尔 , 汤姆·扎哈维 , 萨汀德·辛格 :
非稳态环境中的超梯度。 CoRR公司 腹肌/2209.06159 ( 2022 ) [i16] 迈克尔·鲍林 , 约翰·D·马丁 , 埃布尔 , 威尔·达布尼 :
解决奖励假设。 CoRR公司 abs/2212.10420 ( 2022 ) 2021 [第19条] 埃尔万·勒卡普蒂埃 , 埃布尔 , 卡沃什·阿萨迪 , 尤金奈 , 伊曼纽尔·拉切尔森 , 迈克尔·利特曼 :
利普希茨终身强化学习。 AAAI公司 2021 : 8270-8278 [第18条] Tadashi Kozuno公司 , 汤云浩 , 马克·罗兰 , 雷米·穆诺斯 , 史蒂文·卡普托洛夫斯基 , 威尔·达布尼 , 米哈尔·瓦尔科 , 埃布尔 :
重温彭氏现代强化学习的Q(λ)。 ICML公司 2021 : 5794-5804 [第17条] 埃布尔 , 威尔·达布尼 , 安娜·哈里顿扬(Anna Harutyunyan) , 马克·K·何 , 迈克尔·利特曼 , Doina预备 , 萨汀德·辛格 :
马尔可夫报酬的表示性。 NeurIPS公司 2021 : 7799-7812 【i15】 Tadashi Kozuno公司 , 汤云浩 , 马克·罗兰 , 雷米·穆诺斯 , 史蒂文·卡普托洛夫斯基 , 威尔·达布尼 , 米查尔·瓦尔科 , 埃布尔 :
重温彭氏现代强化学习的Q(λ)。 CoRR公司 abs/2103.00107 ( 2021 ) [第14条] 马克·K·何 , 埃布尔 , 卡洛斯·科雷亚 , 迈克尔·利特曼 , 乔纳森·科恩 , 托马斯·格里菲斯 :
人类规划中心理表征的控制。 CoRR公司 abs/2105.06948 ( 2021 ) [i13] 埃布尔 , 卡梅隆·艾伦 , 迪利普·阿鲁穆甘 , D.埃利斯·赫什科维茨 , 迈克尔·L·利特曼 , 劳森·L·S·王 :
不良政策密度:强化学习硬度的测量。 CoRR公司 abs/2110.03424 ( 2021 ) [i12] 埃布尔 , 威尔·达布尼 , 安娜·哈里顿扬(Anna Harutyunyan) , 马克·K·何 , 迈克尔·利特曼 , Doina预备 , 萨汀德·辛格 :
马尔可夫报酬的表示性。 CoRR公司 腹肌/2111.00876 ( 2021 ) 2020 【b1】 埃布尔 :
强化学习中的抽象理论。 美国布朗大学, 2020 [第16条] 马克·K·何 , 埃布尔 , 乔纳森·科恩 , 迈克尔·利特曼 , 托马斯·格里菲斯 :
人们不仅要计划,还要计划。 AAAI公司 2020 : 1300-1307 [第15条] 埃布尔 , 内特·乌姆班霍瓦尔 , Khimya Khetarpal公司 , 迪利普·阿鲁穆甘 , Doina Precup公司 , 迈克尔·利特曼 :
保值状态-动作抽象。 AISTATS公司 2020 : 1639-1650 [第14条] Khimya Khetarpal公司 , 扎法拉利·艾哈迈德 , 科摩罗人 , 埃布尔 , Doina Precup公司 :
我能在这里做什么? 强化学习中的负担理论。 ICML公司 2020 : 5243-5253 [i11] 埃尔万·勒卡普蒂埃 , 埃布尔 , 卡沃什·阿萨迪 , 尤金奈 , 伊曼纽尔·拉切尔森 , 迈克尔·利特曼 :
利普希茨终身强化学习。 CoRR公司 abs/2001.05411 ( 2020 ) [i10] 卡沃什·阿萨迪 , 埃布尔 , 利特曼 :
连续控制中转移的学习状态抽象。 CoRR公司 abs/2002.05518 ( 2020 ) [第九章] 马克·K·何 , 埃布尔 , 乔纳森·科恩 , 迈克尔·利特曼 , 托马斯·格里菲斯 :
人类认知的效率反映了有计划的信息处理。 CoRR公司 abs/2002.05769 ( 2020 ) [i8] Khimya Khetarpal公司 , 扎法拉利·艾哈迈德 , Gheorghe Comanici公司 , 埃布尔 , Doina Precup公司 :
我在这里能做什么? 强化学习中的负担理论。 CoRR公司 abs/2006.15085 ( 2020 )
2010 – 2019
2019 [第13条] 埃布尔 , 迪利普·阿鲁穆甘 , 卡沃什·阿萨迪 , 尤金奈 , 迈克尔·利特曼 , 劳森·L·S·王 :
学徒学习中的状态抽象压缩。 AAAI公司 2019 : 3134-3142 [第12条] 埃布尔 :
强化学习的状态抽象理论。 AAAI公司 2019 : 9876-9877 [第11条] 埃布尔 :
simple_rl:Python中的可再现强化学习。 ICLR处RML 2019 [第10条] 尤金奈 , 埃布尔 , 大卫·埃利斯·赫什科维茨 , 迈克尔·利特曼 , 乔治·迪米特里·科尼达里斯 :
寻找尽可能减少计划时间的选项。 ICML公司 2019 : 3120-3129 【c9】 尤金奈 , 纪元公园 , 埃布尔 , 乔治·迪米特里·科尼达利斯 :
通过最小化覆盖时间发现探索选项。 ICML公司 2019 : 3130-3139 【c8】 埃布尔 , 约翰·温德 , 玛丽·德斯贾丁斯 , 迈克尔·利特曼 :
期权的预期长度模型。 国际JCAI 2019 : 1951-1958 [i7] 尤金奈 , Jee Won公园 , 埃布尔 , 乔治·迪米特里·科尼达利斯 :
通过最小化覆盖时间发现探索选项。 CoRR公司 abs/1903.00606 ( 2019 ) 2018 【c7】 埃布尔 , 爱德华·威廉姆斯 , 斯蒂芬·布劳纳 , 艾米丽·雷夫 , 迈克尔·利特曼 :
基于Bandit的太阳能电池板控制。 AAAI公司 2018 : 7713-7718 【c6】 埃布尔 , 迪利普·阿鲁穆甘 , 卢卡斯·莱纳特 , 迈克尔·利特曼 :
终身强化学习的状态抽象。 ICML公司 2018 : 10-19 【c5】 埃布尔 , 尤金奈 , 苏菲·越国 , 乔治·迪米特里·科尼达利斯 , 迈克尔·利特曼 :
终身强化学习中的政策和价值转移。 ICML公司 2018 : 20-29 [i6] 尤金奈 , 埃布尔 , 迈克尔·利特曼 , 乔治·迪米特里·科尼达利斯 :
寻找尽可能减少计划时间的选项。 CoRR公司 abs/1810.07311 ( 2018 ) [i5] 迪利普·阿鲁穆甘 , 埃布尔 , 卡沃什·阿萨迪 , 纳库尔·戈帕兰 , 克里斯托弗·格里姆 , 李俊基 , 卢卡斯·莱纳特 , 迈克尔·利特曼 :
缓解基于模型的强化学习中的计划员过度拟合。 CoRR公司 腹肌/1812.01129 ( 2018 ) 2017 [i4] 埃布尔 , 约翰·萨尔瓦蒂尔 , 安德烈亚斯·斯图尔穆勒 , 欧文·埃文斯 :
Agent-Agnostic人在回路强化学习。 CoRR公司 abs/1701.04079 ( 2017 ) [i3] 埃布尔 , D.埃利斯·赫什科维茨 , 迈克尔·利特曼 :
通过近似状态抽象实现近似最优行为。 CoRR公司 abs/1701.04113 ( 2017 ) [i2] 克里斯托弗·格林 , 迪利普·阿鲁穆甘 , Siddharth Karamcheti公司 , 埃布尔 , Lawson L.S.Wong律师事务所 , 迈克尔·利特曼 :
潜在注意网络。 CoRR公司 腹肌/1706.00536 ( 2017 ) 2016 【c4】 埃布尔 , 詹姆斯·麦克拉桑 , 迈克尔·利特曼 :
强化学习作为道德决策的框架。 AAAI研讨会:AI、道德与社会 2016 【c3】 埃布尔 , D.埃利斯·赫什科维茨 , 迈克尔·利特曼 :
通过近似状态抽象实现近似最优行为。 ICML公司 2016 : 2915-2923 [i1] 埃布尔 , 阿列克·阿加瓦尔 , 费尔南多·迪亚兹 , 阿克谢·克里希纳穆尔西(Akshay Krishnamurthy) , 罗伯特·夏皮雷 :
复杂领域强化学习的探索性梯度推进。 CoRR公司 abs/1603.04119 ( 2016 ) 2015 【c2】 埃布尔 , D.埃利斯·赫什科维茨 , 加布里埃尔·巴特·马龙 , 斯蒂芬·布劳纳 , 凯文·奥法雷尔 , 詹姆斯·麦克拉桑 , 斯蒂芬妮·特莱克斯 :
基于目标的行动优先。 ICAPS公司 2015 : 306-314 2014 【c1】 加布里埃尔·巴特·马龙 , 埃布尔 , 詹姆斯·麦克拉桑 , 斯蒂芬妮·泰勒克斯 :
成本作为规划代理的可转让知识。 AAAI秋季研讨会 2014