谢恩·莱格
人员信息
优化列表
2020年–今天
2024 [i51] SIMA团队 , 玛丽亚·阿比·拉德 , 阿伦·阿胡贾 , 卡塔琳娜·巴罗斯 , 弗雷德里克·贝塞 , 博尔特 , 阿德里安·博尔顿 , 贝瑟妮·布朗菲尔德 , 加文·布蒂莫尔 , 最大铁路超高 , 莎拉·查卡拉 , 斯蒂芬妮·C.Y.·陈 , 杰夫·克伦 , 阿德里安·科利斯特 , 维基·科普曼 , 亚历克斯·卡卢姆 , Ishita Dasgupta公司 , 达里奥·德·塞萨尔 , 朱莉娅·迪·特拉帕尼 , 亚尼·唐切夫 , 艾玛·邓利维 , 马丁·恩格尔克 , 瑞恩·福克纳 , 弗兰基·加西亚 , 查尔斯·巴达莫西 , 龚志涛 , 露西·冈萨雷斯 , 古普塔 , 卡罗尔·格雷戈 , 阿恩·奥拉夫·哈林斯塔德 , 蒂姆·哈雷 , 萨姆·哈夫斯 , 费利克斯·希尔 , 埃德·赫斯特 , 德鲁·A·哈德森 , 乔尼·哈德森 , 斯蒂夫·休斯·菲特 , 丹尼尔·雷泽德 , 米米·贾萨列维奇 , 劳拉·坎皮斯 , 南·罗斯玛丽·科 , 托马斯·凯克 , 金俊庆(Junkyung Kim) , 奥斯卡·克纳格 , 卡维亚·科帕拉普 , 安德鲁·兰皮宁 , 谢恩·莱格 , 亚历山大·勒克纳 , 马乔丽·利蒙特 , 刘玉兰 , 玛丽亚·洛克斯·汤普森 , 约瑟夫·马里诺 , 凯瑟琳·马丁·库森 , 洛伊克·马特(Loic Matthey) , Siobhan Mcloughlin公司 , 皮尔玛丽亚·门多利奇奥 , 哈姆扎·梅尔齐克 , 安娜·米滕科娃 , 亚历山大·穆法雷克 , 瓦莱里亚·奥利维拉 , 扬科·吉塔希·奥利维拉 , 汉娜·Openshaw , 潘仁科 , 阿内什·帕普 , 亚历克斯·普拉托诺夫 , 奥利·珀基斯 , David P.Reichert(大卫·雷切尔) , 约翰·里德 , 皮埃尔·哈维·里奇蒙 , 泰森-罗伯茨 , 贾尔斯·鲁斯科 , 杰米·桑切斯·埃利亚斯 , 塔沙·桑德斯 , 丹尼尔·索耶 , 蒂姆·斯科尔斯 , 盖·西蒙斯 , 丹尼尔·斯莱特 , 休伯特·索耶 , 海科·斯特拉赫曼 , 彼得·斯特斯 , Allison C.Tam公司 , 丹尼斯·特普利亚辛 , 泰富·特尔齐 , 戴维德·维切利 , 博扬·武贾托维奇 , 马库斯·温赖特 , 简·X·王 , 王正东 , Daan Wierstra公司 , 邓肯·威廉姆斯 , 纳撒尼尔·王 , 莎拉·约克 , 尼克杨 :
在许多模拟世界中扩展可指导代理。 CoRR公司 腹肌/240410179 ( 2024 ) 2023 [公元25年] 阿尼安·若斯 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 蒂姆·吉纳温 , 乔迪·格拉乌·莫亚 , 罗贝尔·索尔达斯 , 本纳尼 , 谢恩·莱格 , 乔尔·维内斯 :
随机位置编码促进了变压器的长度泛化。 ACL(2) 2023 : 1889-1903 [公元24年] 格雷戈伊尔·德雷唐(Grégoire Delétang) , 阿尼安·若斯 , 乔迪·格拉乌·莫亚 , 蒂姆·吉纳温 , 李凯文文亮 , 埃利奥特·卡特 , 克里斯·库迪 , 马库斯·赫特 , 谢恩·莱格 , 乔尔·维内斯 , 佩德罗·奥尔特加 :
神经网络和乔姆斯基层次结构。 ICLR公司 2023 【i50】 阿尼安·若斯 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 蒂姆·吉纳温 , 乔迪·格拉乌·莫亚 , 罗贝尔·索尔达斯 , 本纳尼 , 谢恩·莱格 , 乔尔·维内斯 :
随机位置编码促进了变压器的长度泛化。 CoRR公司 abs/2305.16843 ( 2023 ) [i49] 托马斯·麦格拉思 , 马修·拉赫茨 , 杰诺斯·克拉马尔 , 弗拉基米尔·米库利克 , 谢恩·莱格 :
Hydra效应:语言模型计算中的紧急自我修复。 CoRR公司 abs/2307.15771 ( 2023 ) [i48] 梅雷迪思·林格尔·莫里斯 , 贾沙·索尔·迪克斯坦(Jascha Sohl-Dickstein) , 诺亚·菲德尔 , 特里斯·沃肯廷 , 阿兰·达福 , 阿列克桑德拉·福斯特 , 克莱门·法拉贝特 , 谢恩·莱格 :
AGI水平:AGI道路上的操作化进展。 CoRR公司 腹肌/2311.02462 ( 2023 ) 2022 [j7] 罗伯·布雷克尔曼斯 , 蒂姆·吉纳温 , 乔迪·格拉乌·莫亚 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 马库斯·库内什 , 谢恩·莱格 , 佩德罗·奥尔特加 :
你的政策规划者是一个秘密的对手。 事务处理。 机器。 学习。 物件。 2022 ( 2022 ) [i47] 马修·拉赫茨 , 维克兰·瓦尔马 , 拉马纳·库马尔 , 扎卡里·肯顿 , 谢恩·莱格 , 简·雷克 :
使用人的反馈在3D环境中实现安全深度RL。 CoRR公司 abs/2201.08102 ( 2022 ) [i46] 罗伯·布雷克尔曼斯 , 蒂姆·吉纳温 , 乔迪·格拉乌·莫亚 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 马库斯·库内什 , 谢恩·莱格 , 佩德罗·奥尔特加 :
你的政策规划者是一个秘密的对手。 CoRR公司 abs/2203.12592 ( 2022 ) [i45] 格雷戈伊尔·德雷唐(Grégoire Delétang) , 阿尼安·若斯 , 乔迪·格拉乌·莫亚 , 蒂姆·吉纳温 , 李凯文文亮 , 埃利奥特·卡特 , 马库斯·赫特 , 谢恩·莱格 , 佩德罗·奥尔特加 :
神经网络和乔姆斯基层次结构。 CoRR公司 abs/2207.02098 ( 2022 ) [i44] 乔迪·格拉乌·莫亚 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 马库斯·库内什 , 蒂姆·吉纳温 , 埃利奥特·卡特 , 李凯文 , 阿尼安·若斯 , 克里斯·库迪 , 乔尔·维内斯 , 简·X·王 , 马库斯·赫特 , 克里斯托弗·萨默菲尔德 , 谢恩·莱格 , 佩德罗·奥尔特加 :
超越贝叶斯优化:元学习你知道你不知道的东西。 CoRR公司 abs/2209.15618 ( 2022 ) 2021 【c23】 汤姆·艾唯瑞特 , 瑞恩·凯里 , 埃里克·兰格洛伊斯 , 佩德罗·奥尔特加 , 谢恩·莱格 :
代理人激励:因果视角。 AAAI公司 2021 : 11487-11495 [公元22年] 亚当·格莱夫 , 迈克尔·丹尼斯 , 谢恩·莱格 , 斯图尔特·罗素 , 简·雷克 :
量化奖励功能的差异。 ICLR公司 2021 [i43] 汤姆·艾唯瑞特 , 瑞恩·凯里 , 埃里克·兰格洛伊斯 , 佩德罗·奥尔特加 , 谢恩·莱格 :
代理人激励:因果视角。 CoRR公司 abs/2102.01685 ( 2021 ) [i42] 格雷戈伊尔·德雷唐(Grégoire Delétang) , 乔迪·格拉乌·莫亚 , 米尔扬·马蒂奇 , 蒂姆·吉纳温 , 汤姆·麦格拉思 , 弗拉基米尔·米库利克 , 马库斯·库内什 , 谢恩·莱格 , 佩德罗·奥尔特加 :
人工智能安全代理行为的因果分析。 CoRR公司 abs/2103.03938 ( 2021 ) [i41] 佩德罗·奥尔特加 , 马库斯·库内什 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 蒂姆·吉纳温 , 乔迪·格拉乌·莫亚 , 乔尔·维内斯 , 乔纳斯·布赫利 , 乔纳斯·迪格雷夫 , 比拉尔·皮奥 , 朱利安·佩罗拉 , 汤姆·艾唯瑞特 , 科伦蒂·塔莱克 , 埃米利奥·帕里索托 , 汤姆·埃雷斯 , 陈玉田 , 斯科特·里德 , 马库斯·赫特 , 南多·德·弗雷塔斯 , 谢恩·莱格 :
动摇基础:交互和控制序列模型中的错觉。 CoRR公司 abs/2110.10819 ( 2021 ) [i40] 格雷戈伊尔·德雷唐(Grégoire Delétang) , 乔迪·格拉乌·莫亚 , 马库斯·库内什 , 蒂姆·吉纳温 , 罗伯·布雷克尔曼斯 , 谢恩·莱格 , 佩德罗·奥尔特加 :
无模型风险敏感强化学习。 CoRR公司 abs/2111.02907 ( 2021 ) 2020 [j6] 达格马尔·莫内特 , 科林·W·P·刘易斯 , 克里斯汀·托里森 , 乔沙·巴赫 , 吉安卢卡·巴尔达萨雷 , 乔瓦尼·格拉纳托 , Istvan S.N.伯克利 , 弗朗索瓦·霍利特 , 马修·克罗斯比 , 亨利·谢夫林 , 约翰·索瓦 , 约翰·莱尔德 , 谢恩·莱格 , 彼得·林德斯 , 托马斯·米科洛夫 , 威廉·拉帕波特 , 劳尔·罗哈斯 , 马雷克·罗莎 , 斯通 , 理查德·萨顿 , 罗曼·亚姆波尔斯基 , 王培(音译) , 罗杰·沙克 , 亚伦·斯洛曼 , 艾伦·F·T·温菲尔德 :
特刊“关于人工智能的定义”-评论和作者的回应。 J.阿蒂夫。 发电机智能。 11 ( 2 ) : 1-100 ( 2020 ) 【c21】 西德哈斯·雷迪 , 安卡·D·德拉甘 , 谢尔盖·莱文 , 谢恩·莱格 , 简·雷克 :
通过评估假设行为来学习人类目标。 ICML公司 2020 : 8020-8029 [公元20年] 斯图尔特·阿姆斯特朗 , 简·雷克 , 劳伦特·奥尔索 , 谢恩·莱格 :
在线学习奖励功能的陷阱。 国际JCAI 2020 : 1592-1600 [第19条] 维多利亚·克拉科夫纳 , 劳伦特·奥尔索 , 理查德·恩戈(Richard Ngo) , Miljan Martic公司 , 谢恩·莱格 :
通过考虑未来任务避免副作用。 NeurIPS公司 2020 [c18] 弗拉基米尔·米库利克 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 汤姆·麦格拉思 , 蒂姆·吉纳温 , Miljan Martic公司 , 谢恩·莱格 , 佩德罗·奥尔特加 :
元训练代理实现贝叶斯优化代理。 NeurIPS公司 2020 [i39] 瑞恩·凯里 , 埃里克·兰格洛伊斯 , 汤姆·艾唯瑞特 , 谢恩·莱格 :
塑造行为的激励因素。 CoRR公司 abs/2001.07118 ( 2020 ) [i38] 斯图尔特·阿姆斯特朗 , 简·雷克 , 劳伦特·奥尔索 , 谢恩·莱格 :
在线学习奖励功能的陷阱。 CoRR公司 abs/2004.13654 ( 2020 ) [i37] 亚当·格莱夫 , 迈克尔·丹尼斯 , 谢恩·莱格 , 斯图尔特·罗素 , 简·雷克 :
量化奖励功能的差异。 CoRR公司 abs/2006.13900 ( 2020 ) [公元36年] 维多利亚·克拉科夫纳 , 劳伦特·奥尔索 , 理查德·恩戈(Richard Ngo) , 米尔扬·马蒂奇 , 谢恩·莱格 :
通过考虑未来任务避免副作用。 CoRR公司 abs/2010.07877 ( 2020 ) [i35] 弗拉基米尔·米库利克 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 汤姆·麦格拉思 , 蒂姆·吉纳温 , Miljan Martic公司 , 谢恩·莱格 , 佩德罗·奥尔特加 :
元训练代理实现贝叶斯优化代理。 CoRR公司 abs/2010.11223 ( 2020 ) [i34] 蒂姆·吉纳温 , 汤姆·麦格拉思 , 格雷戈伊尔·德雷唐(Grégoire Delétang) , 弗拉基米尔·米库利克 , Miljan Martic公司 , 谢恩·莱格 , 佩德罗·奥尔特加 :
概率树因果推理算法。 CoRR公司 abs/2010.12237 ( 2020 ) [i33] 拉马娜·库马尔 , 乔纳森·尤萨托 , 理查德·恩戈(Richard Ngo) , 汤姆·艾唯瑞特 , 维多利亚·克拉科夫纳 , 谢恩·莱格 :
REALab:关于篡改的嵌入式视角。 CoRR公司 abs/2011.08820 ( 2020 ) [i32] 乔纳森·尤萨托 , 拉马纳·库马尔 , 维多利亚·克拉科夫纳 , 汤姆·艾唯瑞特 , 理查德·恩戈(Richard Ngo) , 谢恩·莱格 :
通过解耦批准避免在Deep RL中篡改激励。 CoRR公司 abs/2011.08827 ( 2020 )
2010 – 2019
2019 [第17条] 汤姆·艾唯瑞特 , 拉马纳·库马尔 , 维多利亚·克拉科夫纳 , 谢恩·莱格 :
使用因果影响图对AGI安全框架进行建模。 AIS安全@IJCAI 2019 [第16条] 维多利亚·克拉科夫纳 , 劳伦特·奥尔索 , Miljan Martic公司 , 谢恩·莱格 :
使用逐步相对可达性惩罚副作用。 AI安全@IJCAI 2019 [i31] 劳伦特·奥尔索 , 托拉蒂莫尔 , 谢恩·莱格 :
软贝叶斯(Soft-Bayes):为具有对数损失的专家组合设计。 CoRR公司 abs/1901.02230 ( 2019 ) [i30] 汤姆·艾唯瑞特 , 佩德罗·奥尔特加 , 伊丽莎白·巴恩斯 , 谢恩·莱格 :
使用因果影响图了解代理人激励。 第一部分:单动作设置。 CoRR公司 abs/1902.09980 ( 2019 ) [i29] 佩德罗·奥尔特加 , 简·X·王 , 马克·罗兰 , 蒂姆·吉纳温 , 泽布·库思·内尔森 , 拉兹万·帕斯卡努 , 尼古拉斯·希斯 , 乔尔·维内斯 , 亚历山大·普里策 , 巴勃罗·斯普雷希曼 , Siddhant M.Jayakumar先生 , 汤姆·麦格拉思 , 凯文·米勒 , 穆罕默德·盖什拉希·阿扎尔 , 伊恩·奥斯班德 , 尼尔·C·拉比诺维茨 , 安德烈斯·吉尔吉 , 西尔维娅·齐亚帕 , 西蒙·奥斯宾多 , 叶惠德 , 哈多·范·哈塞尔特 , 南多·德·弗雷塔斯 , 马修·博特维尼克 , 谢恩·莱格 :
序列策略的元学习。 CoRR公司 abs/1905.03030 ( 2019 ) [第28条] 汤姆·艾唯瑞特 , 拉马纳·库马尔 , 维多利亚·克拉科夫纳 , 谢恩·莱格 :
使用因果影响图对AGI安全框架进行建模。 CoRR公司 abs/1906.08663 ( 2019 ) [i27] 西德哈斯·雷迪 , 安卡·D·德拉甘 , 谢尔盖·莱文 , 谢恩·莱格 , 简·莱克 :
通过评估假设行为来学习人类目标。 CoRR公司 abs/1912.05652 ( 2019 ) 2018 [第15条] 迈尔·福图纳托 , 穆罕默德·盖什拉希·阿扎尔 , 比拉尔·皮奥 , 雅各布·梅尼克 , 马特奥·赫塞尔 , 伊恩·奥斯班德 , 亚历克斯·格拉夫斯 , 沃洛德米尔·姆尼赫 , 雷米·穆诺斯 , 哈萨比斯 , 奥利维尔·皮特金 , 查尔斯·布伦德尔 , 谢恩·莱格 :
探索的嘈杂网络。 ICLR(海报) 2018 [第14条] 拉斯·埃斯佩霍尔特 , 休伯特·索耶 , 雷米·穆诺斯 , 凯伦·西蒙扬 , 沃洛德米尔·姆尼赫 , 汤姆·沃德 , 约塔姆·多隆 , 弗拉德·菲鲁 , 蒂姆·哈雷 , 伊恩·邓宁 , 谢恩·莱格 , 科雷·卡武科格鲁 :
IMPALA:具有重要性加权参与者-学习者体系结构的可扩展分布式Deep-RL。 ICML公司 2018 : 1406-1415 [第13条] 博尔贾·伊巴兹 , 简·雷克 , 托比亚斯·波伦 , 杰弗里·欧文 , 谢恩·莱格 , 达里奥·阿莫迪 :
奖励从人类偏好和Atari演示中学习。 NeurIPS公司 2018 : 8022-8034 [i26] 乔尔·雷波 , Cyprien de Masson d'Autume公司 , 丹尼尔·佐兰 , 大卫·阿莫斯 , 查尔斯·比蒂 , 基思·安德森 , 安东尼奥·加西亚·卡斯塔涅达 , 马努埃尔·桑切斯 , 西蒙·格林 , Audrunas Gruslys公司 , 谢恩·莱格 , 哈萨比斯 , 马修·博特维尼克 :
心理实验室:深度强化学习代理的心理实验室。 CoRR公司 abs/1801.08116 ( 2018 ) [i25] 拉斯·埃斯佩霍尔特 , 休伯特·索耶 , 雷米·穆诺斯 , 凯伦·西蒙扬 , 沃洛德米尔·姆尼赫 , 汤姆·沃德 , 约塔姆·多隆 , 弗拉德·菲鲁 , 蒂姆·哈利 , 伊恩·邓宁 , 谢恩·莱格 , 科雷·卡武科格鲁 :
IMPALA:具有重要性加权参与者-学习者体系结构的可扩展分布式Deep-RL。 CoRR公司 abs/1802.01561 ( 2018 ) 【i24】 劳伦特·奥尔索 , 西蒙·麦格雷戈·麦吉尔 , 谢恩·莱格 :
代理和设备:代理的相对定义。 CoRR公司 abs/1805.12387 ( 2018 ) [第23条] 维多利亚·克拉科夫纳 , 劳伦特·奥尔索 , 米尔扬·马蒂奇 , 谢恩·莱格 :
使用相对可达性测量和避免副作用。 CoRR公司 abs/1806.01186 ( 2018 ) [i22] 佩德罗·奥尔特加 , 谢恩·莱格 :
塑造朋友和敌人。 CoRR公司 abs/1807.00196 ( 2018 ) 【i21】 博尔贾·伊巴兹 , 简·雷克 , 托比亚斯·波伦 , 杰弗里·欧文 , 谢恩·莱格 , 达里奥·阿莫迪 :
奖励从人类偏好和Atari演示中学习。 CoRR公司 abs/1811.06521 ( 2018 ) [i20] 简·雷克 , 大卫·克鲁格 , 汤姆·艾唯瑞特 , Miljan Martic公司 , 维沙尔·梅尼 , 谢恩·莱格 :
通过奖励建模实现可伸缩的代理对齐:一个研究方向。 CoRR公司 abs/1811.07871 ( 2018 ) [i19] Miljan Martic公司 , 简·雷克 , 安德鲁·特拉斯克 , 马特奥·赫塞尔 , 谢恩·莱格 , Pushmet Kohli公司 :
通过模型拆分扩展共享模型治理。 CoRR公司 abs/1812.05979 ( 2018 ) 2017 [第12条] 劳伦特·奥尔索 , 托拉蒂莫尔 , 谢恩·莱格 :
软贝叶斯(Soft-Bayes):为具有对数损失的专家组合设计。 中高音 2017 : 372-399 [第11条] 汤姆·艾唯瑞特 , 维多利亚·克拉科夫纳 , 劳伦特·奥尔索 , 谢恩·莱格 :
通过腐败的奖励渠道强化学习。 国际JCAI 2017 : 4705-4713 [第10条] 保罗·F·克里斯蒂亚诺 , 简·雷克 , 汤姆·B·布朗 , Miljan Martic公司 , 谢恩·莱格 , 达里奥·阿莫迪 :
从人类偏好中深度强化学习。 NIPS公司 2017 : 4299-4307 [i18] 汤姆·艾唯瑞特 , 维多利亚·克拉科夫纳 , 劳伦特·奥尔索 , 马库斯·赫特 , 谢恩·莱格 :
通过腐败的奖励渠道强化学习。 CoRR公司 abs/1705.08417 ( 2017 ) [i17] 保罗·F·克里斯蒂亚诺 , 简·雷克 , 汤姆·B·布朗 , Miljan Martic公司 , 谢恩·莱格 , 达里奥·阿莫迪 :
从人类偏好中进行深度强化学习。 CoRR公司 abs/1706.03741 ( 2017 ) [i16] 迈尔·福图纳托 , 穆罕默德·盖什拉希·阿扎尔 , 比拉尔·皮奥 , 雅各布·梅尼克 , 伊恩·奥斯班德 , 亚历克斯·格拉夫斯 , Vlad Mnih公司 , 雷米·穆诺斯 , 哈萨比斯 , 奥利维尔·皮特金 , 查尔斯·布伦德尔 , 谢恩·莱格 :
探索的嘈杂网络。 CoRR公司 abs/1706.10295 ( 2017 ) 【i15】 卡尔·图尔斯 , 朱利安·佩罗拉 , 马克·兰科特 , 乔治·奥斯特罗夫斯基 , 拉胡尔·萨瓦尼 , 乔尔·雷波 , 托比·奥德 , 格雷佩尔 , 谢恩·莱格 :
非对称博弈的对称分解。 CoRR公司 abs/1711.05074 ( 2017 ) [第14条] 马修·博特维尼克 , 大卫·G·T·巴雷特 , 彼得·巴塔利亚 , 南多·德·弗雷塔斯 , 达山库马兰 , 乔尔·雷波 , 蒂姆·利利克拉普 , 约瑟夫·莫达伊尔 , S.穆罕默德 , 尼尔·C·拉比诺维茨 , 达尼洛·希门尼斯·雷岑德 , 亚当·桑托罗 , 汤姆·绍尔 , 克里斯托弗·萨默菲尔德 , 格雷格·韦恩 , 西奥芬妮·韦伯 , Daan Wierstra公司 , 谢恩·莱格 , 哈萨比斯 :
《构建自我学习和思考的机器:莱克等人评论》,《行为与大脑科学》,2017年。 CoRR公司 abs/1711.08378 ( 2017 ) [i13] 简·雷克 , Miljan Martic公司 , 维多利亚·克拉科夫纳 , 佩德罗·奥尔特加 , 汤姆·艾唯瑞特 , 安德鲁·勒弗朗克 , 劳伦特·奥尔索 , 谢恩·莱格 :
AI安全网格世界。 CoRR公司 abs/1711.09883 ( 2017 ) 2016 [i12] 查尔斯·比蒂 , 乔尔·雷波 , 丹尼斯·特普利亚辛 , 汤姆·沃德 , 马库斯·温赖特 , 海因里希·库特勒 , 安德鲁·勒弗朗克 , 西蒙·格林 , 维克托·巴尔德斯 , 阿米尔·萨迪克 , 朱利安·施里特维瑟 , 基思·安德森 , 莎拉·约克 , 最大铁路超高 , 亚当·凯恩 , 阿德里安·博尔顿 , 斯蒂芬·加夫尼 , 海伦·金 , 哈萨比斯 , 谢恩·莱格 , 斯蒂格·彼得森 :
DeepMind实验室。 CoRR公司 腹肌/1612.03801 ( 2016 ) 2015 [j5] 斯图尔特·罗素 , 汤姆·迪特里希 , 霍尔维茨 , 巴特·塞尔曼 , 弗朗西丝卡·罗西 , 哈萨比斯 , 谢恩·莱格 , 穆斯塔法·苏莱曼 , 迪利普·乔治 , D.斯科特·菲尼克斯 :
致编辑的信:稳健和有益的人工智能的研究重点:一封公开信。 人工智能杂志。 36 ( 4 ) : 3-4 ( 2015 ) 【j4】 沃洛德米尔·姆尼赫 , 科雷·卡武科格鲁 , 大卫·西尔弗 , 安德烈·鲁苏 , 乔尔·维内斯 , 马克·贝勒马尔 , 亚历克斯·格拉夫斯 , 马丁·里德米勒 , 安德烈亚斯·菲德杰兰 , 乔治·奥斯特罗夫斯基 , 斯蒂格·彼得森 , 查尔斯·比蒂 , 阿米尔·萨迪克 , Ioannis Antonoglou公司 , 海伦·金 , 达山库马兰 , Daan Wierstra公司 , 谢恩·莱格 , 哈萨比斯 :
通过深度强化学习进行人性化控制。 国家。 518 ( 7540 ) : 529-533年 ( 2015 ) [i11] 阿伦·奈尔 , 普拉文·斯里尼瓦桑 , 萨姆·布莱克威尔 , 卡格达斯·阿尔切克 , 罗里·费伦 , 亚历山德罗·德·玛丽亚 , Vedavyas Panneershelvam公司 , 穆斯塔法·苏莱曼 , 查尔斯·比蒂 , 斯蒂格·彼得森 , 谢恩·莱格 , 沃洛德米尔·姆尼赫 , 科雷·卡武科格鲁 , 大卫·西尔弗 :
深度强化学习的大规模并行方法。 CoRR公司 abs/1507.04296 ( 2015 ) 2014 【c9】 谢恩·莱格 :
从学术界到工业界:谷歌DeepMind的故事。 ICCSW公司 2014 : 1 2011 【c8】 谢恩·莱格 , 乔尔·维内斯 :
通用智能测度的近似值。 算法概率与朋友 2011 : 236-249 [i10] 谢恩·莱格 , 乔尔·维内斯 :
通用智能测度的近似值。 CoRR公司 腹肌/1109.5951 ( 2011 )
2000 – 2009
2008 [第九章] 马库斯·赫特 , 谢恩·莱格 :
没有学习率的时差更新。 CoRR公司 abs/0810.5631 ( 2008 ) 2007 [j3] 谢恩·莱格 , 马库斯·赫特 :
通用智能:机器智能的定义。 Minds马赫。 17 ( 4 ) : 391-444年 ( 2007 ) [注2] 马库斯·赫特 , 谢恩·莱格 , 保罗·M·B·维坦伊 :
算法概率。 学者媒体 2 ( 8 ) : 2572 ( 2007 ) 【c7】 马库斯·赫特 , 谢恩·莱格 :
没有学习率的时差更新。 NIPS公司 2007 : 705-712 [i8] 谢恩·莱格 , 马库斯·赫特 :
智力定义汇编。 CoRR公司 abs/0706.3639 ( 2007 ) [i7] 谢恩·莱格 , 马库斯·赫特 :
通用智能:机器智能的定义。 CoRR公司 abs/0712.3329 ( 2007 ) [i6] 谢恩·莱格 , 马库斯·赫特 :
机器智能测试。 CoRR公司 abs/0712.3825 ( 2007 ) 2006 [j1] 马库斯·赫特 , 谢恩·莱格 :
健身制服优化。 IEEE传输。 进化。 计算。 10 ( 5 ) : 568-589 ( 2006 ) 【c6】 谢恩·莱格 , 马库斯·赫特 :
智力定义汇编。 AGI公司 2006 : 17-24 【c5】 谢恩·莱格 , 马库斯·赫特 :
机器智能测试。 人工智能50年 2006 : 232至242 【c4】 谢恩·莱格 :
有一个优雅的普遍预测理论吗? 中高音 2006 : 274-287 [i5] 谢恩·莱格 , 马库斯·赫特 :
机器智能的正式度量。 CoRR公司 abs/cs/0605024 ( 2006 ) [i4] 谢恩·莱格 :
有一个优雅的普遍预测理论吗? CoRR公司 abs/cs/0606070 ( 2006 ) [i3] 马库斯·赫特 , 谢恩·莱格 :
健身统一优化。 CoRR公司 abs/cs/0610126 ( 2006 ) 2005 [c3] 谢恩·莱格 , 马库斯·赫特 :
健身统一删除:保持多样性的简单方法。 GECCO公司 2005 : 1271年-1278年 【c2】 谢恩·莱格 , 马库斯·赫特 :
人工智能的通用度量。 国际JCAI 2005 : 1509-1510 [i2] 谢恩·莱格 , 马库斯·赫特 :
健身制服删除:保持多样性的简单方法。 CoRR公司 abs/cs/0504035 ( 2005 ) 2004 【c1】 谢恩·莱格 , 马库斯·赫特 , 阿克沙特·库马尔 :
比赛与健身制服选择。 IEEE进化计算大会 2004 : 2144-2151 [i1] 谢恩·莱格 , 马库斯·赫特 , 阿克沙特·库马尔 :
锦标赛vs.健身制服选择。 CoRR公司 反恐精英。 LG/0403038号 ( 2004 ) 2000 [第1页] 克里斯蒂安·卡鲁德 , 赫尔穆特·尤根森 , 谢恩·莱格 :
用有限测试集解决问题。 有限与无限 2000 : 第39页至第52页