停止战争！

Остановите войну!

对于科学家：

默认搜索操作

组合dblp搜索
作者搜索
场馆搜索
出版物搜索

问别人

大卫·布兰德福恩布雷纳

>主页 >珀森斯

人员信息

优化列表

优化激活！

放大了??属于??记录

查看优化列表

导出优化列表为

显示全部 ??记录

2020年–今天

请参阅常见问题解答

出版物列表中颜色的含义是什么？

2024
[第14条]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2402-01032
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2402-01032
萨米·杰拉西,大卫·布兰德福恩布雷纳,沙姆·M·卡卡德,埃兰·马拉奇:
在我后面重复：变形金刚在复制方面比状态空间模型好。 CoRR公司 abs/2402.01032(2024)
[i13]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2402-08147
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2402-08147
大卫·布兰德福恩布雷纳,锡比·拉贾,塔伦·普拉萨德,克洛伊·拉夫里奇,杨建昂,西蒙·海尼格尔,威廉·伯德,罗伯特·津科夫,纳达·阿明:
使用大型语言模型和蒙特卡罗树搜索验证了多步综合。 CoRR公司腹肌/2402.08147(2024)
[i12]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2402-14688
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2402-14688
肯尼思李,萨米·杰拉西,休·张（Hugh Zhang）,沙姆·M·卡卡德,瓦滕伯格,大卫·布兰德福恩布雷纳:
Q-Probe：一种轻量级语言模型奖励最大化方法。 CoRR公司 abs/2402.14688(2024)
2023
【c7】
- 看法
  权限控制：
- 出口记录
  dblp键：
  - conf/icra/BrandfonbrenerTSWBMV23
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/icra/BrandfonbrenerTSWBMV23
大卫·布兰德福恩布雷纳,斯蒂芬·图,阿维·辛格,斯特凡·韦尔克,查德·布杜,尼古拉·马特尼,杰克·瓦利:
视觉回溯遥操作：基于离线图像强化学习的数据收集协议。 ICRA公司 2023:11336-11342
【c6】
- 看法
  - 电子版@nips.cc（开放存取）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/nips/BrandfonbrenerN23
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/BrandfonbrenerN23
大卫·布兰德福恩布雷纳,奥菲尔·纳楚姆,琼·布鲁纳:
逆动力学预训练学习多任务模拟的良好表现。 NeurIPS公司 2023
[i11]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 期刊/corr/abs-2305-16985
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2305-16985
大卫·布兰德福恩布雷纳,奥菲尔·纳楚姆,琼·布鲁纳:
逆动力学预训练学习多任务模拟的良好表现。 CoRR公司 abs/2305.16985(2023)
2022
【c5】
- 看法
  - 电子版@nips.cc（开放存取）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/nips/BrandfonbrenerB22
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/BrandfonbrenerB22
大卫·布兰德福恩布雷纳,阿尔贝托·比埃蒂,雅各布·巴克曼,罗曼·拉罗什,琼·布鲁纳:
返回条件监督学习何时对离线强化学习起作用？ NeurIPS公司 2022
[i10]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 日记账/corr/abs-2201-13425
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2201-13425
丹尼斯·亚拉特斯,大卫·布兰德丰布雷纳,郝刘,迈克尔·拉斯金,彼得·阿比尔,亚历山德罗·拉扎里奇,勒勒·平托:
不要改变算法，改变数据：离线强化学习的探索性数据。 CoRR公司 abs/2201.13425(2022)
[第九章]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2206-01079
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2206-01079
大卫·布兰德福恩布雷纳,阿尔贝托·比埃蒂,雅各布·巴克曼,罗曼·拉罗什,琼·布鲁纳:
返回条件监督学习何时对离线强化学习起作用？ CoRR公司 abs/2206.01079(2022)
[i8]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2206-01085
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2206-01085
大卫·布兰德福恩布雷纳,Remi Tachet des Combes公司,罗曼·拉罗什:
将显式不确定性估计纳入深度离线强化学习。 CoRR公司 abs/2206.01085(2022)
[i7]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-220-02343
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2210-02343
大卫·布兰德福恩布雷纳,斯蒂芬·图,阿维·辛格,斯特凡·韦尔克,查德·布杜,尼古拉·马特尼,杰克·瓦利:
视觉回溯遥操作：基于离线图像强化学习的数据收集协议。 CoRR公司 abs/2210.02343(2022)
2021
【c4】
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/icml/BrandfonbrenerW21
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/icml/BrandfonbrenerW21
大卫·布兰德福恩布雷纳,威廉·惠特尼,拉杰什·兰加纳思,琼·布鲁纳:
具有过度参数化模型的脱机上下文盗贼。 ICML公司 2021:1049-1058
【c3】
- 看法
  - 电子版@neurips.cc（开放存取）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/nips/BrandfonbrenerW21文件
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/BrandfonbrenerW21
大卫·布兰德福恩布雷纳,威尔·惠特尼,拉杰什·兰加纳思,琼·布鲁纳:
无非政策评估的离线RL。 NeurIPS公司 2021:4933-4946
[i6]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 日记账/corr/abs-2106-08909
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2106-08909
大卫·布兰德福恩布雷纳,威廉·惠特尼,拉杰什·兰加纳思,琼·布鲁纳:
无非政策评估的离线RL。 CoRR公司 abs/2106.08909(2021)
[i5]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-2112-00950
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2112-00950
大卫·布兰德福恩布雷纳,威廉·惠特尼,拉杰什·兰加纳思,琼·布鲁纳:
分位数过滤模拟学习。 CoRR公司 abs/2112.00950(2021)
2020
【c2】
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/aistats/ZanetteBBPL20
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/aistats/ZanetteBBPL20
安德烈亚·扎内特,大卫·布兰德福恩布雷纳,艾玛·布伦斯基,马蒂奥·皮罗塔,亚历山德罗·拉扎里奇:
随机最小二乘值迭代的频繁后悔界。 AISTATS公司 2020:1954-1964
【c1】
- 看法
  - 电子版@openreview.net（开放访问）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/iclr/BrandfonbrenerB20
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/icr/BrandfonbrenerB20
大卫·布兰德福恩布雷纳,琼·布鲁纳:
非线性TD学习收敛的几何观点。 ICLR公司 2020
[i4]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-2006-15368
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2006-15368
大卫·布兰德福恩布雷纳,威廉·惠特尼,拉杰什·兰加纳思,琼·布鲁纳:
离线策略学习中的过度匹配与优化。 CoRR公司 abs/2006.15368(2020)
[i3]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-2009-07368
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2009-07368
威廉·惠特尼,宋敏杰,大卫·布兰德福恩布雷纳,Jaan Altosaar公司,Kyunghyun Cho（赵京贤）:
通过学习低损失预测因子的复杂性来评估表征。 CoRR公司 abs/2009.07368(2020)

2010 – 2019

请参阅常见问题解答

出版物列表中颜色的含义是什么？

2019
[i2]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-1905-12185
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-1905-12185
大卫·布兰德丰布雷纳,琼·布鲁纳:
关于非线性TD学习的预期动力学。 CoRR公司 abs/1905.12185(2019)
[i1]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-1911-00567
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-1911-00567
安德烈亚·扎内特,大卫·布兰德福恩布雷纳,马蒂奥·皮罗塔,亚历山德罗·拉扎里奇:
随机最小二乘值迭代的频繁后悔界。 CoRR公司 abs/1911.00567(2019)
2018
[j1]
- 看法
  权限控制：
- 出口记录
  dblp键：
  - 期刊/组合学/BrandfonbrenerD18
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/combinatics/BrandfonbreerD18
大卫·布兰德福恩布雷纳,帕特·德夫林,内塔内尔·弗里登伯格,宇轩可,斯特芬·马库斯,亨利·赖查德,伊桑·塞阿玛:
图的雅可比矩阵的两顶点生成器。电子。J.库姆。 25(1):1(2018)

合著者索引

请参阅常见问题解答

服务

管理网站设置

为了保护您的隐私，所有依赖浏览器外部API调用的功能都是默认情况下关闭。你需要选择加入，让他们变得活跃。此处的所有设置将在您的web浏览器中存储为cookie。有关详细信息查看我们的F.A.Q。