汤姆·勒潘恩
人员信息
优化列表
2020年–今天
2023 [i18] 吉安卢卡·斯卡佩里尼 , 克塞尼娅·科努什科娃 , 克劳迪奥·范塔奇 , 汤姆·勒潘恩 , 陈玉田 , 米沙·丹尼尔 :
π2vec:具有继任者特征的政策表述。 CoRR公司 abs/2306.09800 ( 2023 ) [i17] 米歇尔·马修 , 谢尔吉尔·奥扎尔 , 斯利瓦桑·斯里尼瓦桑 , 圣格雷 , 张尚通 , 雷·江 , 汤姆·勒佩恩 , 鲍威尔 , 康拉德·佐纳 , 朱利安·施里特维瑟 , 大卫·H·崔 , 佩特科·乔治耶夫 , 丹尼尔·富山 , Aja Huang(黄亚佳) , 罗马戒指 , 伊戈尔·巴布什金 , 蒂莫·埃瓦兹 , Mahyar Bordbar公司 , 萨拉亨德森 , 塞尔吉奥·戈梅斯·科尔梅纳雷霍 , 阿伦·范登·奥尔德 , Wojciech Marian Czarnecki公司 , 南多·德·弗雷塔斯 , Oriol葡萄酒 :
AlphaStar未插塞:大规模离线强化学习。 CoRR公司 abs/2308.03526 ( 2023 ) [i16] 圣格雷 , 汤姆·勒佩恩 , 斯利瓦桑·斯里尼瓦桑 , 克塞尼娅·科努什科娃 , 洛特威茨 , 阿披舍克·夏尔马 , 阿迪蒂亚·西德汉特 , 亚历克斯·埃亨 , 王妙森 , 顾晨杰 , 沃尔夫冈·马切里 , 阿诺·杜塞特 , 奥汉·菲拉特 , 南多·德·弗雷塔斯 :
语言建模强化自我训练(ReST)。 CoRR公司 abs/2308.08998 ( 2023 ) 2022 [注2] 陈玉田 , 徐丽媛 , 圣格雷 , 汤姆·勒佩恩 , 亚瑟·格雷顿 , 南多·德·弗雷塔斯 , 阿诺·杜塞特 :
深度离线政策评估的工具变量回归。 J.马赫。 学习。 物件。 23 : 302:1-302:40 ( 2022 ) 2021 【c7】 贾斯汀·傅 , 穆罕默德·诺鲁齐 , 奥菲尔·纳楚姆 , 乔治·塔克 , 王子玉 , 亚历山大·诺维科夫 , 杨梦娇 , 迈克尔·R·张 , 陈玉田 , 阿维拉尔·库马尔 , 科斯敏·帕杜拉鲁 , 谢尔盖·莱文 , 汤姆·勒佩恩 :
深度政策评估基准。 ICLR公司 2021 【i15】 贾斯汀·傅 , 穆罕默德·诺鲁齐 , 奥菲尔·纳楚姆 , 乔治·塔克 , 王子玉 , 亚历山大·诺维科夫 , 杨梦娇 , 迈克尔·R·张 , 陈玉田 , 阿维拉尔·库马尔 , 科斯敏·帕杜拉鲁 , 谢尔盖·莱文 , 汤姆·勒佩恩 :
深度政策评估基准。 CoRR公司 abs/2103.16596 ( 2021 ) [第14条] 迈克尔·R·张 , 汤姆·勒潘恩 , 奥菲尔·纳楚姆 , 科斯敏·帕杜拉鲁 , 乔治·塔克 , 王子玉 , 穆罕默德·诺鲁齐 :
离线策略评估和优化的自回归动力学模型。 CoRR公司 abs/2104.13877 ( 2021 ) [i13] 陈玉田 , 徐丽媛 , 圣格雷 , 汤姆·勒佩恩 , 亚瑟·格雷顿 , 南多·德·弗雷塔斯 , 阿诺·杜塞特 :
深度离线政策评估的工具变量回归。 CoRR公司 abs/2105.10148 ( 2021 ) 2020 【c6】 圣格雷 , 汤姆·勒佩恩 , 博巴克·沙里亚里 , 米沙·丹尼尔 , 马特哈夫曼 , 休伯特·索耶 , 理查德·坦伯恩 , 史蒂文·卡普图洛夫斯基 , 尼尔·C·拉比诺维茨 , 邓肯·威廉姆斯 , 加布里埃尔·巴特·马龙 , 王子玉 , 南多·德·弗雷塔斯 , Worlds团队 :
有效利用演示解决困难的探索问题。 ICLR公司 2020 [i12] 马特哈夫曼 , 博巴克·沙里亚里 , 约翰·阿斯兰尼德斯 , 加布里埃尔·巴特·马龙 , 费亚尔·M·P·贝巴哈尼 , 塔玛拉·诺曼 , 阿巴斯·阿卜多尔马利基 , 阿尔宾·卡西尔 , 范扬 , 凯特·鲍姆利 , 萨拉亨德森 , 亚历山大·诺维科夫 , 塞尔吉奥·戈梅斯·科尔梅纳雷霍 , 塞尔坎·卡比 , 圣格雷 , 汤姆·勒佩恩 , 安德鲁·考伊 , 王子玉 , 比拉尔·皮奥 , 南多·德·弗雷塔斯 :
Acme:分布式强化学习的研究框架。 CoRR公司 abs/2006.00979 ( 2020 ) [i11] 圣格雷 , 王子玉 , 亚历山大·诺维科夫 , 汤姆·勒佩恩 , 塞尔吉奥·戈梅斯·科尔梅纳雷霍 , 康拉德·佐尔纳 , 里沙布·阿加瓦尔 , 乔什·梅雷尔 , 丹尼尔·曼科维茨 , 科斯敏·帕杜拉鲁 , 加布里埃尔·杜拉克-阿诺德 , 杰里·李 , 穆罕默德·诺鲁齐 , 马特哈夫曼 , 奥菲尔·纳楚姆 , 乔治·塔克 , 尼古拉斯·希斯 , 南多·德·弗雷塔斯 :
RL Unplugged:离线强化学习的基准。 CoRR公司 abs/2006.13888 ( 2020 ) [i10] 汤姆·勒潘恩 , 科斯敏·帕杜拉鲁 , 安德烈亚·米奇 , 圣格雷 , 康拉德·佐纳 , 亚历山大·诺维科夫 , 王子玉 , 南多·德·弗雷塔斯 :
离线强化学习的超参数选择。 CoRR公司 abs/2007.09055 ( 2020 )
2010 – 2019
2019 [j1] Oriol葡萄酒 , 伊戈尔·巴布什金 , Wojciech M.Czarnecki公司 , 米歇尔·马修 , 安德鲁·杜季克 , 钟俊英(Junyoung Chung) , 大卫·H·崔 , 鲍威尔 , 蒂莫·埃瓦兹 , 佩特科·乔治耶夫 , Junhyuk噢 , 丹·霍根 , 曼纽尔·克罗伊斯 , 伊沃·达尼赫尔卡 , Aja Huang(黄亚佳) , 劳伦特·西弗雷 , 特雷弗·蔡 , 约翰·阿加皮欧 , 马克斯·贾德伯格 , 亚历山大·萨沙·维日涅维茨 , 雷米·勒布朗德 , 托比亚斯·波伦 , 瓦伦丁·达利巴德 , 大卫·布登 , 尤里·苏尔斯基 , 詹姆斯·莫洛伊 , 汤姆·勒佩恩 , 圣格雷 , 王子玉 , 托拜厄斯·普法夫 , 吴雨怀 , 罗马戒指 , Dani Yogatama公司 , 达里奥·温施 , 卡特里娜·麦金尼 , 奥利弗·史密斯 , 汤姆·绍尔 , 蒂莫西·P·利利克拉普 , 科雷·卡武科格鲁 , 哈萨比斯 , Chris应用程序 , 大卫·西尔弗 :
星际争霸II中使用多智能体强化学习的大师级。 国家。 575 ( 7782 ) : 350-354 ( 2019 ) [第九章] 汤姆·勒佩恩 , 圣格雷 , 博巴克·沙里亚里 , 米沙牛仔 , 马特哈夫曼 , 休伯特·索耶 , 理查德·坦伯恩 , 史蒂文·卡普托洛夫斯基 , 尼尔·C·拉比诺维茨 , 邓肯·威廉姆斯 , 加布里埃尔·巴特·马龙 , 王子玉 , 南多·德·弗雷塔斯 , 世界团队 :
有效利用演示解决困难的探索问题。 CoRR公司 abs/1909.01387 ( 2019 ) [i8] 阿尔伯特·顾 , 圣格雷 , 汤姆·勒潘恩 , 马修·霍夫曼 , 拉兹万·帕斯卡努 :
改进递归神经网络的选通机制。 CoRR公司 abs/1910.09890 ( 2019 ) 2018 【c5】 优素福·艾塔尔 , 托拜厄斯·普法夫 , 大卫·布登 , 汤姆·勒佩恩 , 王子玉 , 南多·德·弗雷塔斯 :
通过观看YouTube进行艰苦的探索游戏。 NeurIPS公司 2018 : 2935-2945 [i7] 优素福·艾塔尔 , 托拜厄斯·普法夫 , 大卫·布登 , 汤姆·勒佩恩 , 王子玉 , 南多·德·弗雷塔斯 :
通过观看YouTube进行艰苦的探索游戏。 CoRR公司 abs/1805.11592 ( 2018 ) [i6] 汤姆·勒佩恩 , 塞尔吉奥·戈麦斯·科尔梅纳雷霍 , 王子玉 , 斯科特·E·里德 , 优素福·艾塔尔 , 托拜厄斯·普法夫 , 马修·霍夫曼 , 加布里埃尔·巴特·马龙 , 塞尔坎·卡比 , 大卫·布登 , 南多·德·弗雷塔斯 :
一拍高清晰度模拟:用RL训练大型深网。 CoRR公司 abs/1810.05017 ( 2018 ) 2017 【c4】 普拉吉特·拉马钱德兰 , 汤姆·勒佩恩 , Pooya Khorrami公司 , 穆罕默德·巴巴耶扎德 , Shiyu Chang先生 , Yang Zhang(张阳) , Mark A.Hasegawa-约翰逊 , 罗伊·H·坎贝尔 , 托马斯·S·黄 :
卷积自回归模型的快速生成。 ICLR(车间) 2017 [i5] 普拉吉特·拉马钱德兰 , 汤姆·勒潘恩 , Pooya Khorrami公司 , 穆罕默德·巴巴耶扎德 , Shiyu Chang先生 , Yang Zhang(张阳) , Mark A.Hasegawa-约翰逊 , 罗伊·H·坎贝尔 , 托马斯·S·黄 :
卷积自回归模型的快速生成。 CoRR公司 abs/1704.06001 ( 2017 ) 2016 【c3】 Pooya Khorrami公司 , 汤姆·勒佩恩 , 布拉迪 , 查理·达格利 , 托马斯·S·黄 :
深度神经网络如何改进视频数据的情感识别。 ICIP公司 2016 : 619-623 [i4] Pooya Khorrami公司 , 汤姆·勒佩恩 , 布拉迪 , 查理·达格利 , 托马斯·S·黄 :
深度神经网络如何提高视频数据的情感识别。 CoRR公司 abs/1602.07377 ( 2016 ) [i3] 魏翰 , Pooya Khorrami公司 , 汤姆·勒佩恩 , 普拉吉特·拉马钱德兰 , 穆罕默德·巴巴耶扎德 , 石红辉 , 李建安 , 水城岩 , 托马斯·S·黄 :
用于视频对象检测的Seq-NMS。 CoRR公司 abs/1602.08465 ( 2016 ) [i2] 汤姆·勒佩恩 , Pooya Khorrami公司 , 张世玉 , Yang Zhang(张阳) , 普拉吉特·拉马钱德兰 , Mark A.Hasegawa-约翰逊 , 托马斯·S·黄 :
快速波网生成算法。 CoRR公司 abs/1611.09482 ( 2016 ) 2015 【c2】 Pooya Khorrami公司 , 汤姆·勒佩恩 , 托马斯·S·黄 :
深度神经网络在进行表情识别时学习面部动作单位吗? ICCV研讨会 2015 : 19-27 【c1】 汤姆·勒佩恩 , Pooya Khorrami公司 , 魏翰 , 托马斯·S·黄 :
根据最新进展分析无监督预训练。 ICLR(车间) 2015 [i1] Pooya Khorrami公司 , 汤姆·勒佩恩 , 托马斯·S·黄 :
深度神经网络在进行表情识别时学习面部动作单位吗? CoRR公司 abs/1510.02969 ( 2015 )