休伯特·索耶
人员信息
SPARQL查询
优化列表
2020年–今天
2024 [i11] SIMA团队 , 玛丽亚·阿比·拉德 , 阿伦·阿胡贾 , 卡塔琳娜·巴罗斯 , 弗雷德里克·贝塞 , 博尔特 , 阿德里安·博尔顿 , 贝萨尼·布朗菲尔德 , 加文·布蒂莫尔 , 最大铁路超高 , 莎拉·查卡拉 , 斯蒂芬妮·C.Y.·陈 , 杰夫·克伦 , 阿德里安·科利斯特 , 维基·科普曼 , 亚历克斯·卡卢姆 , Ishita Dasgupta公司 , 达里奥·德·塞萨尔 , 朱莉娅·迪·特拉帕尼 , 亚尼·唐切夫 , 艾玛·邓利维 , 马丁·恩格尔克 , 瑞恩·福克纳 , 弗兰基·加西亚 , 查尔斯·巴达莫西 , 龚志涛 , 露西·冈萨雷斯 , 克什蒂吉·古普塔 , 卡罗尔·格雷戈 , 阿恩·奥拉夫·哈林斯塔德 , 蒂姆·哈雷 , 萨姆·哈夫斯 , 费利克斯·希尔 , 埃德·赫斯特 , 德鲁·A·哈德森 , 乔尼·哈德森 , 斯蒂夫·休斯·菲特 , 丹尼尔·雷泽德 , 米米·贾萨列维奇 , 劳拉·坎皮斯 , 南·罗斯玛丽·科 , 托马斯·凯克 , 金俊庆(Junkyung Kim) , 奥斯卡·克纳格 , 卡维亚·科帕拉普 , 安德鲁·兰皮宁 , 谢恩·莱格 , 亚历山大·勒克纳 , 马乔里·利蒙特 , 刘玉兰 , 玛丽亚·洛克斯·汤普森 , 约瑟夫·马里诺 , 凯瑟琳·马丁·库森 , 洛伊克·马特(Loic Matthey) , Siobhan Mcloughlin公司 , 皮尔玛丽亚·门多利奇奥 , 哈姆扎·梅尔齐克 , 安娜·米滕科娃 , 亚历山大·穆法雷克 , 瓦莱里亚·奥利维拉 , 扬科·吉塔希·奥利维拉 , 汉娜·Openshaw , 潘仁科 , 阿内什·帕普 , 亚历克斯·普拉托诺夫 , 奥利·珀基斯 , David P.Reichert(大卫·雷切尔) , 约翰·里德 , 皮埃尔·哈维·里奇蒙 , 泰森·罗伯茨 , 贾尔斯·鲁斯科 , 杰姆·桑切斯·埃利亚斯 , 塔沙·桑德斯 , 丹尼尔·索耶 , 蒂姆·斯科尔斯 , 盖·西蒙斯 , 丹尼尔·斯莱特 , 休伯特·索耶 , 海科·斯特拉赫曼 , 彼得·斯特斯 , Allison C.Tam公司 , 丹尼斯·特普利亚申 , 泰富·特尔齐 , 戴维德·维切利 , 博扬·武贾托维奇 , 马库斯·温赖特 , 简·X·王 , 王正东 , Daan Wierstra公司 , 邓肯·威廉姆斯 , 纳撒尼尔·王 , 莎拉·约克 , 尼克杨 :
在许多模拟世界中扩展可指导代理。 CoRR公司 abs/2404.10179 ( 2024 ) 2023 [i10] 贝尔纳多·阿维拉·皮雷斯 , 费亚尔·M·P·贝巴哈尼 , 休伯特·索耶 , 基里亚科斯·尼基福鲁 , 托马斯·凯克 , 萨汀德·辛格 :
复杂三维环境中的分层强化学习。 CoRR公司 腹肌/2302.14451 ( 2023 ) 2020 [第11条] 圣格雷 , 汤姆·勒佩恩 , 博巴克·沙里亚里 , 米沙·丹尼尔 , 马特哈夫曼 , 休伯特·索耶 , 理查德·坦伯恩 , 史蒂文·卡普托洛夫斯基 , 尼尔·C·拉比诺维茨 , 邓肯·威廉姆斯 , 加布里埃尔·巴特·马龙 , 王子玉 , 南多·德·弗雷塔斯 , Worlds团队 :
有效利用演示解决困难的探索问题。 ICLR公司 2020 [c10] H.弗朗西斯·宋 , 阿巴斯·阿卜杜勒马利基 , 约斯特·托比亚斯·斯普林伯格 , 艾丹·克拉克 , 休伯特·索耶 , 杰克·W·雷 , 塞布·努里 , 阿伦·阿胡贾 , 刘思奇 , 德鲁瓦·蒂鲁马拉 , 尼古拉斯·希斯 , 丹·贝洛夫 , 马丁·里德米勒 , 马修·博特维尼克 :
V-MPO:On-Policy Maximum,离散和连续控制的后验策略优化。 ICLR公司 2020
2010 – 2019
2019 【c9】 马特奥·赫塞尔 , 休伯特·索耶 , 拉斯·埃斯佩霍尔特 , 沃伊切赫·沙内基(Wojciech Czarnecki) , 西蒙·施密特 , 哈多·范·哈塞尔特 :
PopArt的多任务深度强化学习。 AAAI公司 2019 : 3796-3803 [第九章] 汤姆·勒佩恩 , 圣格雷 , 博巴克·沙里亚里 , 米沙·丹尼尔 , 马特哈夫曼 , 休伯特·索耶 , 理查德·坦伯恩 , 史蒂文·卡普托洛夫斯基 , 尼尔·C·拉比诺维茨 , 邓肯·威廉姆斯 , 加布里埃尔·巴特·马龙 , 王子玉 , 南多·德·弗雷塔斯 , Worlds团队 :
有效利用演示解决困难的探索问题。 CoRR公司 abs/1909.01387 ( 2019 ) [i8] H.弗朗西斯·宋 , 阿巴斯·阿卜杜勒马利基 , 约斯特·托比亚斯·斯普林伯格 , 艾丹·克拉克 , 休伯特·索耶 , 杰克·W·雷 , 塞布·努里 , 阿伦·阿胡贾 , 刘思奇 , 德鲁瓦·蒂鲁马拉 , 尼古拉斯·希斯 , 丹·贝洛夫 , 马丁·里德米勒 , 马修·博特维尼克 :
V-MPO:On-Policy Maximum,离散和连续控制的后验策略优化。 CoRR公司 abs/1909.12238 ( 2019 ) 2018 [j1] 安德烈亚·巴尼诺 , 卡斯韦尔·巴里 , 贝尼尼奥·乌里亚 , 查尔斯·布伦德尔 , 蒂莫西·利利克拉普 , 彼得·米洛夫斯基 , 亚历山大·普里策 , 马丁·查德威克 , 托马斯·迪吉斯 , 约瑟夫·莫达伊尔 , 格雷格·韦恩 , 休伯特·索耶 , 法比奥·维奥拉 , 布莱恩·张 , 罗斯·戈罗欣(Ross Goroshin) , 尼尔·C·拉比诺维茨 , 拉兹万·帕斯卡努 , 查理·比蒂 , 斯蒂格·彼得森 , 阿米尔·萨迪克 , 斯蒂芬·加夫尼 , 海伦·金 , Koray Kavukcuoglu公司 , 哈萨比斯 , Raia Hadsell公司 , 达山库马兰 :
在人工代理中使用类似网格表示的基于矢量的导航。 国家。 557 ( 7705 ) : 429-433 ( 2018 ) 【c8】 拉斯·埃斯佩霍尔特 , 休伯特·索耶 , 雷米·穆诺斯 , 凯伦·西蒙扬 , 沃洛德米尔·姆尼赫 , 汤姆·沃德 , 约塔姆·多伦 , 弗拉德·菲鲁 , 蒂姆·哈雷 , 伊恩·邓宁 , 谢恩·莱格 , Koray Kavukcuoglu公司 :
IMPALA:具有重要性加权参与者-学习者体系结构的可扩展分布式Deep-RL。 ICML公司 2018 : 1406-1415 [i7] 拉斯·埃斯佩霍尔特 , 休伯特·索耶 , 雷米·穆诺斯 , 凯伦·西蒙扬 , 沃洛德米尔·姆尼赫 , 汤姆·沃德 , 约塔姆·多隆 , 弗拉德·菲鲁 , 蒂姆·哈雷 , 伊恩·邓宁 , 谢恩·莱格 , Koray Kavukcuoglu公司 :
IMPALA:具有重要性加权参与者-学习者体系结构的可扩展分布式Deep-RL。 CoRR公司 abs/1802.01561 ( 2018 ) [i6] 托马斯·斯捷普尔顿 , 拉兹万·帕斯卡努 , 威尔·达布尼 , Siddhant M.Jayakumar先生 , 休伯特·索耶 , 雷米·穆诺斯 :
低通递归神经网络-用于长期相关性发现的内存结构。 CoRR公司 abs/1805.04955 ( 2018 ) [i5] 马特奥·赫塞尔 , 休伯特·索耶 , 拉斯·埃斯佩霍尔特 , 沃伊切赫·沙内基(Wojciech Czarnecki) , 西蒙·施密特 , 哈多·范·哈塞尔特 :
PopArt的多任务深度强化学习。 CoRR公司 abs/1809.04474 ( 2018 ) 2017 【c7】 简·王 , 泽布·库思·内尔森 , 休伯特·索耶 , 乔尔·雷波 , 德鲁瓦·蒂鲁马拉 , 雷米·穆诺斯 , 查尔斯·布伦德尔 , 达山库马兰 , 马特·博特维尼克 :
学习强化学习。 CogSci公司 2017 【c6】 彼得·米洛夫斯基 , 拉兹万·帕斯卡努 , 法比奥·维奥拉 , 休伯特·索耶 , 安迪·巴拉德 , 安德烈亚·巴尼诺 , 米沙·丹尼尔 , 罗斯·戈罗欣(Ross Goroshin) , 劳伦特·西弗雷 , Koray Kavukcuoglu公司 , 达山库马兰 , Raia Hadsell公司 :
学习在复杂环境中导航。 ICLR(海报) 2017 [i4] 卡尔·莫里茨·赫尔曼 , 费利克斯·希尔 , 西蒙·格林 , 王富民(音) , 瑞恩·福克纳 , 休伯特·索耶 , 大卫·塞佩斯瓦里 , Wojciech Marian Czarnecki公司 , 马克斯·贾德伯格 , 丹尼斯·特普利亚申 , 马库斯·温赖特 , Chris应用程序 , 哈萨比斯 , 菲尔·布隆森 :
模拟3D世界中的扎根语言学习。 CoRR公司 abs/1706.06551 ( 2017 ) 2016 [i3] 安德烈·鲁苏 , 尼尔·C·拉比诺维茨 , 纪尧姆·德斯贾丁斯 , 休伯特·索耶 , 詹姆斯·柯克帕特里克 , Koray Kavukcuoglu公司 , 拉兹万·帕斯卡努 , Raia Hadsell公司 :
渐进神经网络。 CoRR公司 abs/1606.04671 ( 2016 ) [i2] 彼得·米洛夫斯基 , 拉兹万·帕斯卡努 , 法比奥·维奥拉 , 休伯特·索耶 , 安德鲁·巴拉德 , 安德烈亚·巴尼诺 , 米沙·丹尼尔 , 罗斯·戈罗欣(Ross Goroshin) , 劳伦特·西弗雷 , Koray Kavukcuoglu公司 , 达山库马兰 , Raia Hadsell公司 :
学习在复杂环境中导航。 CoRR公司 abs/1611.03673 ( 2016 ) [i1] 简·X·王 , 泽布·库思·内尔森 , 德鲁瓦·蒂鲁马拉 , 休伯特·索耶 , 乔尔·雷波 , 雷米·穆诺斯 , 查尔斯·布伦德尔 , 达山库马兰 , 马修·博特维尼克 :
学习强化学习。 CoRR公司 abs/1611.05763 ( 2016 ) 2015 【c5】 休伯特·索耶 , Goran主题 , 蓬特斯·斯坦托普 , 爱泽昭子 :
CroVeWA:基于跨语言矢量的写作辅助。 HLT-NAACL公司 2015 : 91-95 【c4】 休伯特·索耶 , 蓬特斯·斯坦托普 , 爱泽昭子 :
利用单语数据进行跨语言合成单词表示。 ICLR(海报) 2015 2014 【c3】 Sho Hoshino公司 , 休伯特·索耶 , Yusuke Miyao先生 , 爱泽昭子 :
使用预排序和组合分布式语义的日英机器翻译。 WAT公司 2014 : 55-63 【c2】 克里斯蒂安·奥斯恩多夫 , 休伯特·索耶 , 帕特里克·范德·斯马特 :
快速近似卷积稀疏编码的图像超分辨率。 图标(3) 2014 : 250-257 2011 【c1】 卢卡斯·戈泽尼亚克 , 安德烈·迪亚斯 , 休伯特·索耶 , 阿洛伊斯·克诺尔 , 亚历山大·霍斯 :
使用机器人手臂评估运动传感器的可变性。 MIE公司 2011 : 897-901