默认搜索操作

组合dblp搜索
作者搜索
场馆搜索
出版物搜索

问别人

大卫·林德纳

>主页 >珀森斯

人员信息

SPARQL查询

优化列表

优化激活！

放大??属于??记录

查看优化列表

导出优化列表为

显示全部 ??记录

2020年–今天

请参阅常见问题解答

出版物列表中的颜色是什么意思？

2024
[第11条]
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/aistats/LindnerCTH024
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/aistats/LindnerCTH024
大卫·林德纳,陈欣,塞巴斯蒂安·奇亚切克,卡贾·霍夫曼,安德烈亚斯·克劳斯:
从未知奖励的演示中学习安全约束。 AISTATS公司 2024:2386-2394
[第10条]
- 看法
  - 电子版@openreview.net（开放访问）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/iclr/RocamondeMNPL24
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/icr/RocamondeMNPL24
胡安·罗卡蒙德,维多利亚·蒙特西诺斯,埃尔维斯·纳瓦,伊桑·佩雷斯,大卫·林德纳:
视觉语言模型是强化学习的零射击奖励模型。 ICLR公司 2024
[i18]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 期刊/corr/abs-2403-13793
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2403-13793
玛丽·冯,马修·艾奇森,埃利奥特·卡特,莎拉·科根,亚历山大·卡斯卡索利,维多利亚·克拉科夫纳,大卫·林德纳,马修·拉赫茨,亚尼斯·阿萨尔,莎拉·霍德金森,海蒂·霍华德,汤姆·利伯伦,拉马纳·库马尔,玛丽亚·阿比·拉德,阿尔伯特·韦伯森,何小黑,莎伦·林,塞巴斯蒂安·法夸尔,马库斯·赫特,格雷戈伊尔·德雷唐（Grégoire Delétang）,阿尼安·鲁斯,塞利姆·埃尔·萨耶德,萨沙·布朗,安卡·D·德拉甘,罗欣·沙阿,阿兰·达福,托比·谢夫兰:
评估危险能力的前沿模型。 CoRR公司 abs/2403.13793(2024)
[i17]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2407-04622
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2407-04622
扎卡里·肯顿,诺亚·Y·西格尔,杰诺斯·克拉马尔,乔纳·布朗·科恩,塞缪尔·奥尔巴尼,詹妮斯·布利安,里沙布·阿加瓦尔,大卫·林德纳,汤云浩,诺亚·D·古德曼,罗欣·沙阿:
弱LLM对强LLM的可扩展监督。 CoRR公司 abs/2407.04622(2024)
2023
【b1】
- 看法
  权限控制：
- 出口记录
  dblp键：
  - 博士/基础搜索/Lindneri23
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/phd/basesearch/Lindneri23
大卫·林德纳:
从人类反馈中安全有效强化学习的算法基础。苏黎世理工大学、瑞士苏黎世，2023
[注2]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 期刊/ai/SukhijaTLKTB23
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/ai/SukhijaTLKTB23
Bhavya Sukhija公司,马特奥·图切塔,大卫·林德纳,安德烈亚斯·克劳斯,塞巴斯蒂安·特里普,多米尼克·鲍曼:
GoSafeOpt：动态系统全局优化的可扩展安全探索。 Artif公司。智力。 320:103922(2023)
[j1]
- 看法
  - 电子版@openreview.net（开放访问）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - 期刊/tmlr/CasperDSGSRFKLF23
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/tmlr/CasperDSGSRFKLF23
斯蒂芬·卡斯珀,桑德·戴维斯,克劳迪娅·施,托马斯·克伦德·吉尔伯特,杰雷米·舍勒,哈维尔·兰多,雷切尔·弗里德曼,托马斯·科巴克,大卫·林德纳,佩德罗·弗雷尔,Tony Tong Wang（托尼·王）,萨缪尔·马克斯,夏贝尔·拉法·塞格里,米卡·卡罗尔,Andi Peng（彭安迪）,菲利普·J·K·克里斯托弗森,梅胡尔·达马尼,斯图尔特·斯洛克姆,安瓦尔,阿南德·西塔哈兰詹（Anand Sittharanjan）,马克斯·纳多,埃里克·米绍德,雅各布·普法,德米特里·克拉申尼科夫,Xin Chen（新晨）,劳罗·兰戈斯科,彼得·哈斯,埃尔登·比伊克,安卡·D·德拉甘,大卫·克鲁格,多萨·萨迪,迪伦·哈德菲尔德-梅内尔:
从人类反馈中强化学习的公开问题和基本局限性。事务处理。机器。学习。物件。 2023(2023)
【c9】
- 看法
  - 电子版@nips.cc（开放存取）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/nips/LindnerKFRMM23
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/LindnerKFRMM23
大卫·林德纳,杰诺斯·克拉马尔,塞巴斯蒂安·法夸尔,马修·拉赫茨,汤姆·麦格拉思,弗拉基米尔·米库利克:
Tracr：编译变形金刚作为可解释性实验室。 NeurIPS公司 2023
[i16]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2301-05062
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2301-05062
大卫·林德纳,杰诺斯·克拉马尔,马修·拉赫茨,托马斯·麦格拉思,弗拉基米尔·米库利克:
Tracr：编译变形金刚作为可解释性实验室。 CoRR公司 abs/2301.05062(2023)
【i15】
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2305-16147
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2305-16147
大卫·林德纳,Xin Chen（新晨）,塞巴斯蒂安·奇亚切克,卡贾·霍夫曼,安德烈亚斯·克劳斯:
从未知奖励的演示中学习安全约束。 CoRR公司 abs/2305.16147(2023)
[第14条]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2307-15217
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2307-15217
斯蒂芬·卡斯珀,桑德·戴维斯,克劳迪娅·施,托马斯·克伦德·吉尔伯特,杰雷米·舍勒,哈维尔·兰多,雷切尔·弗里德曼,托马斯·科巴克,大卫·林德纳,佩德罗·弗雷尔,Tony Tong Wang（托尼·王）,萨缪尔·马克斯,夏贝尔·拉法·塞格里,米卡·卡罗尔,Andi Peng（彭安迪）,菲利普·J·K·克里斯托弗森,梅胡尔·达马尼,斯图尔特·斯洛克姆,安瓦尔,阿南德·西塔哈兰詹（Anand Sittharanjan）,马克斯·纳多,埃里克·米绍德,雅各布·普法,德米特里·克拉申尼科夫,Xin Chen（新晨）,劳罗·兰戈斯科,彼得·哈斯,埃尔登·比伊克,安卡·D·德拉甘,大卫·克鲁格,多萨·萨迪,迪伦·哈德菲尔德-梅内尔:
从人类反馈中强化学习的公开问题和基本局限性。 CoRR公司 abs/2307.15217(2023)
[i13]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2308-04332
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2308-04332
扬尼克·梅茨,大卫·林德纳,拉斐尔·鲍尔,丹尼尔·凯姆,Mennatallah El-Assady公司:
RLHF-Blender：一个可配置的交互式界面，用于从各种人类反馈中学习。 CoRR公司 abs/2308.04332(2023)
[i12]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 期刊/corr/abs-2310-12921
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-230-12921
胡安·罗卡蒙德,维多利亚·蒙特西诺斯,埃尔维斯·纳瓦,伊桑·佩雷斯,大卫·林德纳:
视觉语言模型是强化学习的零射击奖励模型。 CoRR公司 abs/2310.12921(2023)
2022
【c8】
- 看法
  - 电子版@mlr.press（开放存取）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/icml/林德纳TH022
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/icml/LindnerTH022
大卫·林德纳,塞巴斯蒂安·奇亚切克,卡贾·霍夫曼,安德烈亚斯·克劳斯:
线性带中的交互学习偏好约束。 ICML公司 2022:13505-13527
【c7】
- 看法
  - 电子版@nips.cc（开放存取）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/nips/Lindner0R22
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/Lindner0R22
大卫·林德纳,安德烈亚斯·克劳斯,乔治·拉姆波尼:
积极探索反向强化学习。 NeurIPS公司 2022
[i11]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-2201-09562
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2201-09562
Bhavya Sukhija公司,马蒂奥·图切塔,大卫·林德纳,安德烈亚斯·克劳斯,塞巴斯蒂安·特里普,多米尼克·鲍曼:
动态系统全局优化的可扩展安全探索。 CoRR公司 abs/2201.09562(2022)
[i10]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2206-05255
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2206-05255
大卫·林德纳,塞巴斯蒂安·奇亚切克,卡贾·霍夫曼,安德烈亚斯·克劳斯:
线性Bandits中的交互学习偏好约束。 CoRR公司腹肌/2206.05255(2022)
[第九章]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2206-13316
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2206-13316
大卫·林德纳,Mennatallah El-Assady公司:
人类不是波尔兹曼分布：在强化学习中模拟人类反馈和交互的挑战和机遇。 CoRR公司腹肌/2206.13316(2022)
[i8]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-2207-08645
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2207-08645
大卫·林德纳,安德烈亚斯·克劳斯,乔治·拉姆波尼:
积极探索反向强化学习。 CoRR公司 abs/2207.08645(2022)
[i7]
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - 日记账/corr/abs-220-04610
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2210-04610
哈维尔·兰多,丹尼尔·帕莱卡,大卫·林德纳,伦纳特·海姆,弗洛里安电车:
红光稳定扩散安全过滤器。 CoRR公司 abs/2210.04610(2022)
2021
【c6】
- 看法
  - 电子版@ceur-ws.org（开放访问）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/aaai/LindnerMM21
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/aaai/LindnerMM21
大卫·林德纳,凯尔·马托瓦,亚历山大·穆勒曼斯:
使用冲击调节剂避免负面副作用的挑战。 SafeAI@AAAI 2021
【c5】
- 看法
  - 电子版@openreview.net（开放访问）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/icr/LindnerSAD21文件
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/iclr/LindnerSAD21
大卫·林德纳,罗欣·沙阿,彼得·阿比尔,安卡·D·德拉甘:
通过模拟过去学习做什么。 ICLR公司 2021
【c4】
- 看法
  - 通过DOI的电子版（开放存取）
  - 参考文献和引文
  权限控制：
- 出口记录
  dblp键：
  - conf/ijcai/LindnerH021
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/ijcai/LindnerH021
大卫·林德纳,霍达·海达里,安德烈亚斯·克劳斯:
通过政策遗憾解决洗钱决策的长期影响。国际JCAI 2021:537-544
【c3】
- 看法
  - 电子版@neurips.cc（开放存取）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/nips/LindnerTTCK21
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/nips/LindnerTTCK21
大卫·林德纳,马蒂奥·图切塔,塞巴斯蒂安·奇亚切克,卡米尔·乔塞克,安德烈亚斯·克劳斯:
强化学习的信息导向奖励学习。 NeurIPS公司 2021:3850-3862
[i6]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-2101-12509
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2101-12509
大卫·林德纳,凯尔·马托瓦,亚历山大·穆勒曼斯:
使用冲击调节剂避免负面副作用的挑战。 CoRR公司 abs/2101.12509(2021)
[i5]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 轴颈/corr/abs-2102-12466
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2102-12466
大卫·林德纳,马蒂奥·图切塔,塞巴斯蒂安·奇亚切克,卡米尔·乔塞克,安德烈亚斯·克劳斯:
强化学习的信息导向奖励学习。 CoRR公司 abs/2102.12466(2021)
[i4]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-2104-03946
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2104-03946
大卫·林德纳,罗欣·沙阿,彼得·阿比尔,安卡·D·德拉甘:
通过模拟过去学习做什么。 CoRR公司 abs/2104.03946(2021)
[i3]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-2106-01325
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-2106-01325
大卫·林德纳,霍达·海达里,安德烈亚斯·克劳斯:
通过政策遗憾解决洗钱决策的长期影响。 CoRR公司 abs/2106.01325(2021)

2010 – 2019

请参阅常见问题解答

出版物列表中的颜色是什么意思？

2019
【c2】
- 看法
  - 电子版@ceur-ws.org（开放访问）
  - 没有参考文献和引文
- 出口记录
  dblp键：
  - conf/ijcai/MancusoKLS19
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/ijcai/MancusoKLS19
杰森·曼库索,托马斯·基谢列夫斯基,大卫·林德纳,阿洛克·辛格:
马尔可夫决策过程中的尖峰腐败检测。 AIS安全@IJCAI 2019
【c1】
- 看法
  权限控制：
- 出口记录
  dblp键：
  - 网址：conf/www/BeckHLGCHA19
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/conf/www/BeckHLGCHA19
约翰内斯·贝克,罗伯塔·黄,大卫·林德纳,田国,策张,德克·赫尔宾,尼诺·安图洛夫·范图林:
为加密货币新闻感知社交媒体信号。 WWW（配套卷） 2019:1051-1054
[i2]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 期刊/corr/abs-1903-11451
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-1903-11451
约翰内斯·贝克,罗伯塔·黄,大卫·林德纳,田国,策张,德克·赫尔宾,尼诺·安图洛夫·范图林:
为加密货币新闻感知社交媒体信号。 CoRR公司 abs/1903.11451(2019)
[i1]
- 看法
  - 电子版@arxiv.org（开放访问）
  - 参考文献和引文
- 出口记录
  dblp键：
  - 日记账/corr/abs-1907-00452
- 问别人
- 股份记录
  持久URL：
  - https://dblp.org/rec/journals/corr/abs-1907-00452
杰森·曼库索,托马斯·基谢列夫斯基,大卫·林德纳,阿洛克·辛格:
马尔可夫决策过程中的尖峰腐败检测。 CoRR公司 abs/1907.00452(2019)

合著者索引

请参阅常见问题解答

管理站点设置

为了保护您的隐私，所有依赖浏览器外部API调用的功能都是默认情况下关闭。你需要选择加入，让他们变得活跃。此处的所有设置将在您的web浏览器中存储为cookie。有关更多信息查看我们的F.A.Q。