大卫·林德纳
人员信息
SPARQL查询
优化列表
2020年–今天
2024 [第11条] 大卫·林德纳 , 陈欣 , 塞巴斯蒂安·奇亚切克 , 卡贾·霍夫曼 , 安德烈亚斯·克劳斯 :
从未知奖励的演示中学习安全约束。 AISTATS公司 2024 : 2386-2394 [第10条] 胡安·罗卡蒙德 , 维多利亚·蒙特西诺斯 , 埃尔维斯·纳瓦 , 伊桑·佩雷斯 , 大卫·林德纳 :
视觉语言模型是强化学习的零射击奖励模型。 ICLR公司 2024 [i18] 玛丽·冯 , 马修·艾奇森 , 埃利奥特·卡特 , 莎拉·科根 , 亚历山大·卡斯卡索利 , 维多利亚·克拉科夫纳 , 大卫·林德纳 , 马修·拉赫茨 , 亚尼斯·阿萨尔 , 莎拉·霍德金森 , 海蒂·霍华德 , 汤姆·利伯伦 , 拉马纳·库马尔 , 玛丽亚·阿比·拉德 , 阿尔伯特·韦伯森 , 何小黑 , 莎伦·林 , 塞巴斯蒂安·法夸尔 , 马库斯·赫特 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 阿尼安·鲁斯 , 塞利姆·埃尔·萨耶德 , 萨沙·布朗 , 安卡·D·德拉甘 , 罗欣·沙阿 , 阿兰·达福 , 托比·谢夫兰 :
评估危险能力的前沿模型。 CoRR公司 abs/2403.13793 ( 2024 ) [i17] 扎卡里·肯顿 , 诺亚·Y·西格尔 , 杰诺斯·克拉马尔 , 乔纳·布朗·科恩 , 塞缪尔·奥尔巴尼 , 詹妮斯·布利安 , 里沙布·阿加瓦尔 , 大卫·林德纳 , 汤云浩 , 诺亚·D·古德曼 , 罗欣·沙阿 :
弱LLM对强LLM的可扩展监督。 CoRR公司 abs/2407.04622 ( 2024 ) 2023 【b1】 大卫·林德纳 :
从人类反馈中安全有效强化学习的算法基础。 苏黎世理工大学、瑞士苏黎世, 2023 [注2] Bhavya Sukhija公司 , 马特奥·图切塔 , 大卫·林德纳 , 安德烈亚斯·克劳斯 , 塞巴斯蒂安·特里普 , 多米尼克·鲍曼 :
GoSafeOpt:动态系统全局优化的可扩展安全探索。 Artif公司。 智力。 320 : 103922 ( 2023 ) [j1] 斯蒂芬·卡斯珀 , 桑德·戴维斯 , 克劳迪娅·施 , 托马斯·克伦德·吉尔伯特 , 杰雷米·舍勒 , 哈维尔·兰多 , 雷切尔·弗里德曼 , 托马斯·科巴克 , 大卫·林德纳 , 佩德罗·弗雷尔 , Tony Tong Wang(托尼·王) , 萨缪尔·马克斯 , 夏贝尔·拉法·塞格里 , 米卡·卡罗尔 , Andi Peng(彭安迪) , 菲利普·J·K·克里斯托弗森 , 梅胡尔·达马尼 , 斯图尔特·斯洛克姆 , 安瓦尔 , 阿南德·西塔哈兰詹(Anand Sittharanjan) , 马克斯·纳多 , 埃里克·米绍德 , 雅各布·普法 , 德米特里·克拉申尼科夫 , Xin Chen(新晨) , 劳罗·兰戈斯科 , 彼得·哈斯 , 埃尔登·比伊克 , 安卡·D·德拉甘 , 大卫·克鲁格 , 多萨·萨迪 , 迪伦·哈德菲尔德-梅内尔 :
从人类反馈中强化学习的公开问题和基本局限性。 事务处理。 机器。 学习。 物件。 2023 ( 2023 ) 【c9】 大卫·林德纳 , 杰诺斯·克拉马尔 , 塞巴斯蒂安·法夸尔 , 马修·拉赫茨 , 汤姆·麦格拉思 , 弗拉基米尔·米库利克 :
Tracr:编译变形金刚作为可解释性实验室。 NeurIPS公司 2023 [i16] 大卫·林德纳 , 杰诺斯·克拉马尔 , 马修·拉赫茨 , 托马斯·麦格拉思 , 弗拉基米尔·米库利克 :
Tracr:编译变形金刚作为可解释性实验室。 CoRR公司 abs/2301.05062 ( 2023 ) 【i15】 大卫·林德纳 , Xin Chen(新晨) , 塞巴斯蒂安·奇亚切克 , 卡贾·霍夫曼 , 安德烈亚斯·克劳斯 :
从未知奖励的演示中学习安全约束。 CoRR公司 abs/2305.16147 ( 2023 ) [第14条] 斯蒂芬·卡斯珀 , 桑德·戴维斯 , 克劳迪娅·施 , 托马斯·克伦德·吉尔伯特 , 杰雷米·舍勒 , 哈维尔·兰多 , 雷切尔·弗里德曼 , 托马斯·科巴克 , 大卫·林德纳 , 佩德罗·弗雷尔 , Tony Tong Wang(托尼·王) , 萨缪尔·马克斯 , 夏贝尔·拉法·塞格里 , 米卡·卡罗尔 , Andi Peng(彭安迪) , 菲利普·J·K·克里斯托弗森 , 梅胡尔·达马尼 , 斯图尔特·斯洛克姆 , 安瓦尔 , 阿南德·西塔哈兰詹(Anand Sittharanjan) , 马克斯·纳多 , 埃里克·米绍德 , 雅各布·普法 , 德米特里·克拉申尼科夫 , Xin Chen(新晨) , 劳罗·兰戈斯科 , 彼得·哈斯 , 埃尔登·比伊克 , 安卡·D·德拉甘 , 大卫·克鲁格 , 多萨·萨迪 , 迪伦·哈德菲尔德-梅内尔 :
从人类反馈中强化学习的公开问题和基本局限性。 CoRR公司 abs/2307.15217 ( 2023 ) [i13] 扬尼克·梅茨 , 大卫·林德纳 , 拉斐尔·鲍尔 , 丹尼尔·凯姆 , Mennatallah El-Assady公司 :
RLHF-Blender:一个可配置的交互式界面,用于从各种人类反馈中学习。 CoRR公司 abs/2308.04332 ( 2023 ) [i12] 胡安·罗卡蒙德 , 维多利亚·蒙特西诺斯 , 埃尔维斯·纳瓦 , 伊桑·佩雷斯 , 大卫·林德纳 :
视觉语言模型是强化学习的零射击奖励模型。 CoRR公司 abs/2310.12921 ( 2023 ) 2022 【c8】 大卫·林德纳 , 塞巴斯蒂安·奇亚切克 , 卡贾·霍夫曼 , 安德烈亚斯·克劳斯 :
线性带中的交互学习偏好约束。 ICML公司 2022 : 13505-13527 【c7】 大卫·林德纳 , 安德烈亚斯·克劳斯 , 乔治·拉姆波尼 :
积极探索反向强化学习。 NeurIPS公司 2022 [i11] Bhavya Sukhija公司 , 马蒂奥·图切塔 , 大卫·林德纳 , 安德烈亚斯·克劳斯 , 塞巴斯蒂安·特里普 , 多米尼克·鲍曼 :
动态系统全局优化的可扩展安全探索。 CoRR公司 abs/2201.09562 ( 2022 ) [i10] 大卫·林德纳 , 塞巴斯蒂安·奇亚切克 , 卡贾·霍夫曼 , 安德烈亚斯·克劳斯 :
线性Bandits中的交互学习偏好约束。 CoRR公司 腹肌/2206.05255 ( 2022 ) [第九章] 大卫·林德纳 , Mennatallah El-Assady公司 :
人类不是波尔兹曼分布:在强化学习中模拟人类反馈和交互的挑战和机遇。 CoRR公司 腹肌/2206.13316 ( 2022 ) [i8] 大卫·林德纳 , 安德烈亚斯·克劳斯 , 乔治·拉姆波尼 :
积极探索反向强化学习。 CoRR公司 abs/2207.08645 ( 2022 ) [i7] 哈维尔·兰多 , 丹尼尔·帕莱卡 , 大卫·林德纳 , 伦纳特·海姆 , 弗洛里安电车 :
红光稳定扩散安全过滤器。 CoRR公司 abs/2210.04610 ( 2022 ) 2021 【c6】 大卫·林德纳 , 凯尔·马托瓦 , 亚历山大·穆勒曼斯 :
使用冲击调节剂避免负面副作用的挑战。 SafeAI@AAAI 2021 【c5】 大卫·林德纳 , 罗欣·沙阿 , 彼得·阿比尔 , 安卡·D·德拉甘 :
通过模拟过去学习做什么。 ICLR公司 2021 【c4】 大卫·林德纳 , 霍达·海达里 , 安德烈亚斯·克劳斯 :
通过政策遗憾解决洗钱决策的长期影响。 国际JCAI 2021 : 537-544 【c3】 大卫·林德纳 , 马蒂奥·图切塔 , 塞巴斯蒂安·奇亚切克 , 卡米尔·乔塞克 , 安德烈亚斯·克劳斯 :
强化学习的信息导向奖励学习。 NeurIPS公司 2021 : 3850-3862 [i6] 大卫·林德纳 , 凯尔·马托瓦 , 亚历山大·穆勒曼斯 :
使用冲击调节剂避免负面副作用的挑战。 CoRR公司 abs/2101.12509 ( 2021 ) [i5] 大卫·林德纳 , 马蒂奥·图切塔 , 塞巴斯蒂安·奇亚切克 , 卡米尔·乔塞克 , 安德烈亚斯·克劳斯 :
强化学习的信息导向奖励学习。 CoRR公司 abs/2102.12466 ( 2021 ) [i4] 大卫·林德纳 , 罗欣·沙阿 , 彼得·阿比尔 , 安卡·D·德拉甘 :
通过模拟过去学习做什么。 CoRR公司 abs/2104.03946 ( 2021 ) [i3] 大卫·林德纳 , 霍达·海达里 , 安德烈亚斯·克劳斯 :
通过政策遗憾解决洗钱决策的长期影响。 CoRR公司 abs/2106.01325 ( 2021 )
2010 – 2019
2019 【c2】 杰森·曼库索 , 托马斯·基谢列夫斯基 , 大卫·林德纳 , 阿洛克·辛格 :
马尔可夫决策过程中的尖峰腐败检测。 AIS安全@IJCAI 2019 【c1】 约翰内斯·贝克 , 罗伯塔·黄 , 大卫·林德纳 , 田国 , 策张 , 德克·赫尔宾 , 尼诺·安图洛夫·范图林 :
为加密货币新闻感知社交媒体信号。 WWW(配套卷) 2019 : 1051-1054 [i2] 约翰内斯·贝克 , 罗伯塔·黄 , 大卫·林德纳 , 田国 , 策张 , 德克·赫尔宾 , 尼诺·安图洛夫·范图林 :
为加密货币新闻感知社交媒体信号。 CoRR公司 abs/1903.11451 ( 2019 ) [i1] 杰森·曼库索 , 托马斯·基谢列夫斯基 , 大卫·林德纳 , 阿洛克·辛格 :
马尔可夫决策过程中的尖峰腐败检测。 CoRR公司 abs/1907.00452 ( 2019 )