停止战争！

Остановите войну!

对于科学家：

默认搜索操作

组合dblp搜索
作者搜索
场馆搜索
出版物搜索

问别人

埃布尔

>主页 >珀森斯

人员信息

其他同名人员

请参阅常见问题解答

为什么有些名字后面跟着一个四位数的数字？

优化列表

优化激活！

放大了??属于??记录

查看优化列表

将细化列表导出为

显示全部 ??记录

2020年–今天

请参阅常见问题解答

出版物列表中颜色的含义是什么？

2024
【i21】
- 看法
  - 通过DOI的电子版（开放访问）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2405-14769
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2405-14769
彭安迪（Andi Peng）,孙玉英,舒天敏,埃布尔:
语用特征偏好：从人类输入中学习与回报相关的偏好。 CoRR公司 abs/2405.14769(2024)
2023
【c23】
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/icml/保龄球MAD23
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/icml/BowlingMAD23
迈克尔·鲍林,约翰·D·马丁,埃布尔,威尔·达布尼:
解决报酬假说。 ICML公司 2023:3003-3020
[公元22年]
- 看法
  - 电子版@nips.cc（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/nips/Abel0RPHS23
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/Abel0RPHS23
埃布尔,安德烈·巴雷托,本杰明·范罗伊,Doina Precup公司,哈多·菲利普·范·哈塞尔特,萨汀德·辛格:
持续强化学习的定义。 NeurIPS公司 2023
[i20]
- 看法
  - 通过DOI的电子版（开放访问）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2307-11044
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2307-11044
埃布尔,安德烈·巴雷托,哈多·范·哈塞尔特,本杰明·范·罗伊,Doina Precup公司,萨廷德·辛格:
关于有界代理的收敛性。 CoRR公司 abs/2307.11044(2023)
[i19]
- 看法
  - 通过DOI的电子版（开放访问）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2307-11046
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2307-11046
埃布尔,安德烈·巴雷托,本杰明·范罗伊,Doina Precup公司,哈多·范·哈塞尔特,萨汀德·辛格:
持续强化学习的定义。 CoRR公司 abs/2307.11046(2023)
2022
【c21】
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/collas/LuketinaFSAZ022公司
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/collas/LuketinaFSAZ022
杰琳娜·卢凯蒂娜,塞巴斯蒂安·弗伦内尔哈格,扬尼克·施罗德克,埃布尔,汤姆·扎哈维,萨廷德·辛格:
非稳态环境中的超梯度。科拉斯 2022:886-901
[公元20年]
- 看法
  - 通过DOI的电子版（开放访问）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - conf/ijcai/AbelDHHLP022
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/ijcai/AbelDHHLP022
埃布尔,威尔·达布尼,安娜·哈里顿扬（Anna Harutyunyan）,马克·K·何,迈克尔·利特曼,Doina Precup公司,萨汀德·辛格:
马尔可夫报酬的表示（扩展抽象）。国际JCAI 2022:5254-5258
[i18]
- 看法
  - 通过DOI的电子版（开放访问）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2203-00397
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2203-00397
埃布尔:
强化学习中的抽象理论。 CoRR公司 abs/2203.00397(2022)
[i17]
- 看法
  - 通过DOI的电子版（开放访问）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2209-06159
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2209-06159
杰琳娜·卢凯蒂娜,塞巴斯蒂安·弗伦内尔哈格,扬尼克·施罗克,埃布尔,汤姆·扎哈维,萨汀德·辛格:
非稳态环境中的超梯度。 CoRR公司腹肌/2209.06159(2022)
[i16]
- 看法
  - 通过DOI的电子版（开放访问）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2212-10420
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2212-10420
迈克尔·鲍林,约翰·D·马丁,埃布尔,威尔·达布尼:
解决奖励假设。 CoRR公司 abs/2212.10420(2022)
2021
[第19条]
- 看法
  - 通过DOI的电子版（开放访问）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - conf/aaai/LecarpentierAAJ21
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/aaai/LecarpentierAAJ21
埃尔万·勒卡普蒂埃,埃布尔,卡沃什·阿萨迪,尤金奈,伊曼纽尔·拉切尔森,迈克尔·利特曼:
利普希茨终身强化学习。 AAAI公司 2021:8270-8278
[第18条]
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/icml/KozunoTRMKDVA21
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/icml/KozunoTRMKDVA21
Tadashi Kozuno公司,汤云浩,马克·罗兰,雷米·穆诺斯,史蒂文·卡普托洛夫斯基,威尔·达布尼,米哈尔·瓦尔科,埃布尔:
重温彭氏现代强化学习的Q（λ）。 ICML公司 2021:5794-5804
[第17条]
- 看法
  - 电子版@neurips.cc（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/nips/AbelDHHLPS21
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/AbelDHHLPS21
埃布尔,威尔·达布尼,安娜·哈里顿扬（Anna Harutyunyan）,马克·K·何,迈克尔·利特曼,Doina预备,萨汀德·辛格:
马尔可夫报酬的表示性。 NeurIPS公司 2021:7799-7812
【i15】
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 日记账/corr/abs-2103-00107
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2103-00107
Tadashi Kozuno公司,汤云浩,马克·罗兰,雷米·穆诺斯,史蒂文·卡普托洛夫斯基,威尔·达布尼,米查尔·瓦尔科,埃布尔:
重温彭氏现代强化学习的Q（λ）。 CoRR公司 abs/2103.00107(2021)
[第14条]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 日记账/corr/abs-2105-06948
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2105-06948
马克·K·何,埃布尔,卡洛斯·科雷亚,迈克尔·利特曼,乔纳森·科恩,托马斯·格里菲斯:
人类规划中心理表征的控制。 CoRR公司 abs/2105.06948(2021)
[i13]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 日记账/corr/abs-210-03424
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-210-03424
埃布尔,卡梅隆·艾伦,迪利普·阿鲁穆甘,D.埃利斯·赫什科维茨,迈克尔·L·利特曼,劳森·L·S·王:
不良政策密度：强化学习硬度的测量。 CoRR公司 abs/2110.03424(2021)
[i12]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-2111-00876
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2111-00876
埃布尔,威尔·达布尼,安娜·哈里顿扬（Anna Harutyunyan）,马克·K·何,迈克尔·利特曼,Doina预备,萨汀德·辛格:
马尔可夫报酬的表示性。 CoRR公司腹肌/2111.00876(2021)
2020
【b1】
- 看法
  - 电子版@brown.edu
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - 博士/us/Abel20
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/phd/us/Abel20
埃布尔:
强化学习中的抽象理论。美国布朗大学，2020
[第16条]
- 看法
  - 通过DOI的电子版（开放访问）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - conf/aaai/HoACLG20
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/aaai/HoACLG20
马克·K·何,埃布尔,乔纳森·科恩,迈克尔·利特曼,托马斯·格里菲斯:
人们不仅要计划，还要计划。 AAAI公司 2020:1300-1307
[第15条]
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/aistats/AbelUKAPL20
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/aistats/AbelUKAPL20
埃布尔,内特·乌姆班霍瓦尔,Khimya Khetarpal公司,迪利普·阿鲁穆甘,Doina Precup公司,迈克尔·利特曼:
保值状态-动作抽象。 AISTATS公司 2020:1639-1650
[第14条]
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/icml/KhetarpalACAP20
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/icml/KhetarpalACAP20
Khimya Khetarpal公司,扎法拉利·艾哈迈德,科摩罗人,埃布尔,Doina Precup公司:
我能在这里做什么？强化学习中的负担理论。 ICML公司 2020:5243-5253
[i11]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-2001-05411
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2001-05411
埃尔万·勒卡普蒂埃,埃布尔,卡沃什·阿萨迪,尤金奈,伊曼纽尔·拉切尔森,迈克尔·利特曼:
利普希茨终身强化学习。 CoRR公司 abs/2001.05411(2020)
[i10]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-2002-05518
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2002-05518
卡沃什·阿萨迪,埃布尔,利特曼:
连续控制中转移的学习状态抽象。 CoRR公司 abs/2002.05518(2020)
[第九章]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-2002-05769
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2002-05769
马克·K·何,埃布尔,乔纳森·科恩,迈克尔·利特曼,托马斯·格里菲斯:
人类认知的效率反映了有计划的信息处理。 CoRR公司 abs/2002.05769(2020)
[i8]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-2006-15085
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2006-15085
Khimya Khetarpal公司,扎法拉利·艾哈迈德,Gheorghe Comanici公司,埃布尔,Doina Precup公司:
我在这里能做什么？强化学习中的负担理论。 CoRR公司 abs/2006.15085(2020)

2010 – 2019

请参阅常见问题解答

出版物列表中颜色的含义是什么？

2019
[第13条]
- 看法
  - 通过DOI的电子版（开放访问）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - conf/aaai/AbelAAJLW19
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/aaai/AbelAAJLW19
埃布尔,迪利普·阿鲁穆甘,卡沃什·阿萨迪,尤金奈,迈克尔·利特曼,劳森·L·S·王:
学徒学习中的状态抽象压缩。 AAAI公司 2019:3134-3142
[第12条]
- 看法
  - 通过DOI的电子版（开放访问）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - conf/aaai/Abel19
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/aaai/Abel19
埃布尔:
强化学习的状态抽象理论。 AAAI公司 2019:9876-9877
[第11条]
- 看法
  - 电子版@openreview.net（开放访问）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/iclr/Abel19
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/iclr/Abel19
埃布尔:
simple_rl：Python中的可再现强化学习。 ICLR处RML 2019
[第10条]
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/icml/金奈AHLK19
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/icml/JinnaiAHLK19
尤金奈,埃布尔,大卫·埃利斯·赫什科维茨,迈克尔·利特曼,乔治·迪米特里·科尼达里斯:
寻找尽可能减少计划时间的选项。 ICML公司 2019:3120-3129
【c9】
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/icml/金奈PAK19
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/icml/金奈PAK19
尤金奈,纪元公园,埃布尔,乔治·迪米特里·科尼达利斯:
通过最小化覆盖时间发现探索选项。 ICML公司 2019:3130-3139
【c8】
- 看法
  - 通过DOI的电子版（开放访问）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - conf/ijcai/AbelWdL19
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/ijcai/AbelWdL19
埃布尔,约翰·温德,玛丽·德斯贾丁斯,迈克尔·利特曼:
期权的预期长度模型。国际JCAI 2019:1951-1958
[i7]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-1903-00606
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-1903-00606
尤金奈,Jee Won公园,埃布尔,乔治·迪米特里·科尼达利斯:
通过最小化覆盖时间发现探索选项。 CoRR公司 abs/1903.00606(2019)
2018
【c7】
- 看法
  - 通过DOI的电子版（开放访问）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - conf/aaai/AbelWBRL18
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/aaai/AbelWBRL18
埃布尔,爱德华·威廉姆斯,斯蒂芬·布劳纳,艾米丽·雷夫,迈克尔·利特曼:
基于Bandit的太阳能电池板控制。 AAAI公司 2018:7713-7718
【c6】
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/icml/AbelALL18
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/icml/AbelALL18
埃布尔,迪利普·阿鲁穆甘,卢卡斯·莱纳特,迈克尔·利特曼:
终身强化学习的状态抽象。 ICML公司 2018:10-19
【c5】
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/icml/阿贝尔JGKL18
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/icml/AbelJGKL18
埃布尔,尤金奈,苏菲·越国,乔治·迪米特里·科尼达利斯,迈克尔·利特曼:
终身强化学习中的政策和价值转移。 ICML公司 2018:20-29
[i6]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 日记账/corr/abs-1810-07311
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-1810-07311
尤金奈,埃布尔,迈克尔·利特曼,乔治·迪米特里·科尼达利斯:
寻找尽可能减少计划时间的选项。 CoRR公司 abs/1810.07311(2018)
[i5]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 日记账/corr/abs-1812-01129
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-1812-01129
迪利普·阿鲁穆甘,埃布尔,卡沃什·阿萨迪,纳库尔·戈帕兰,克里斯托弗·格里姆,李俊基,卢卡斯·莱纳特,迈克尔·利特曼:
缓解基于模型的强化学习中的计划员过度拟合。 CoRR公司腹肌/1812.01129(2018)
2017
[i4]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/AbelSSE17
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/AbelSSE17
埃布尔,约翰·萨尔瓦蒂尔,安德烈亚斯·斯图尔穆勒,欧文·埃文斯:
Agent-Agnostic人在回路强化学习。 CoRR公司 abs/1701.04079(2017)
[i3]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/AbelHL17
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/AbelHL17
埃布尔,D.埃利斯·赫什科维茨,迈克尔·利特曼:
通过近似状态抽象实现近似最优行为。 CoRR公司 abs/1701.04113(2017)
[i2]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 日记账/corr/GrimmAKAWL17
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/GrimmAKAWL17
克里斯托弗·格林,迪利普·阿鲁穆甘,Siddharth Karamcheti公司,埃布尔,Lawson L.S.Wong律师事务所,迈克尔·利特曼:
潜在注意网络。 CoRR公司腹肌/1706.00536(2017)
2016
【c4】
- 看法
  - 电子版@aaai.org（存档）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/aaai/AbelML16
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/aaai/AbelML16
埃布尔,詹姆斯·麦克拉桑,迈克尔·利特曼:
强化学习作为道德决策的框架。 AAAI研讨会：AI、道德与社会 2016
【c3】
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/icml/AbelHL16
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/icml/AbelHL16
埃布尔,D.埃利斯·赫什科维茨,迈克尔·利特曼:
通过近似状态抽象实现近似最优行为。 ICML公司 2016:2915-2923
[i1]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/AbelADKS16
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/AbelADKS16
埃布尔,阿列克·阿加瓦尔,费尔南多·迪亚兹,阿克谢·克里希纳穆尔西（Akshay Krishnamurthy）,罗伯特·夏皮雷:
复杂领域强化学习的探索性梯度推进。 CoRR公司 abs/1603.04119(2016)
2015
【c2】
- 看法
  - 电子版@aaai.org
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/aips/AbelHBBOMT15
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/aips/AbelHBBOMT15
埃布尔,D.埃利斯·赫什科维茨,加布里埃尔·巴特·马龙,斯蒂芬·布劳纳,凯文·奥法雷尔,詹姆斯·麦克拉桑,斯蒂芬妮·特莱克斯:
基于目标的行动优先。 ICAPS公司 2015:306-314
2014
【c1】
- 看法
  - 电子版@aaai.org
  - 没有可用的参考文献和引文
- 出口记录
  dblp键：
  - conf/aaaifs/Barth-MaronAMT14
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/aaaifs/Barth-MaronAMT14
加布里埃尔·巴特·马龙,埃布尔,詹姆斯·麦克拉桑,斯蒂芬妮·泰勒克斯:
成本作为规划代理的可转让知识。 AAAI秋季研讨会 2014

合著者索引

请参阅常见问题解答

服务

管理网站设置

为了保护您的隐私，所有依赖浏览器外部API调用的功能都是默认情况下关闭。你需要选择加入，让他们变得活跃。此处的所有设置将在您的web浏览器中存储为cookie。有关详细信息查看我们的F.A.Q。