马特奥·赫塞尔
人员信息
SPARQL查询
优化列表
2020年–今天
2022 [公元25年] 大卫·西尔弗 , 阿尼鲁德·戈亚尔 , 伊沃·达尼埃尔卡 , 马特奥·赫塞尔 , 哈多·范·哈塞尔特 :
通过定向梯度下降学习。 ICLR公司 2022 2021 [公元24年] 哈多·范·哈塞尔特 , 丝芙兰Madjiheurem , 马特奥·赫塞尔 , 大卫·西尔弗 , 安德烈·巴雷托 , 戴安娜·博萨 :
预期合格跟踪。 AAAI公司 2021 : 9997-10005 [c23] 马特奥·赫塞尔 , 伊沃·达尼埃尔卡 , 法比奥·维奥拉 , 阿瑟·盖兹 , 西蒙·施密特 , 劳伦特·西弗雷 , 西奥芬妮·韦伯 , 大卫·西尔弗 , 哈多·范·哈塞尔特 :
Muesli:结合策略优化方面的改进。 ICML公司 2021 : 4214-4226 [公元22年] 雷·江 , 汤姆·扎哈维 , 徐忠文 , 亚当·怀特 , 马特奥·赫塞尔 , 查尔斯·布伦德尔 , 哈多·范·哈塞尔特 :
深度强化学习的重点算法。 ICML公司 2021 : 5023-5033 【c21】 格雷戈里·法夸尔 , 凯特·鲍姆利 , 齐塔·马里奥 , 安吉洛斯·菲洛斯 , 马特奥·赫塞尔 , 哈多·菲利普·范·哈塞尔特 , 大卫·西尔弗 :
自我一致的模型和价值观。 NeurIPS公司 2021 : 1111-1125 [公元20年] 维维克·维里亚 , 汤姆·扎哈维 , 马特奥·赫塞尔 , 徐忠文 , Junhyuk噢 , 尤里·凯马耶夫 , 哈多·范·哈塞尔特 , 大卫·西尔弗 , 萨汀德·辛格 :
通过元学习子目标发现选项。 NeurIPS公司 2021 : 29861-29873 [i26] 维维克·维里亚 , 汤姆·扎哈维 , 马特奥·赫塞尔 , 徐忠文 , Junhyuk噢 , 尤里·凯马耶夫 , 哈多·范·哈塞尔特 , 大卫·西尔弗 , 萨汀德·辛格 :
通过元学习子目标发现选项。 CoRR公司 abs/2102.06741 ( 2021 ) [i25] 马特奥·赫塞尔 , 伊沃·达尼埃尔卡 , 法比奥·维奥拉 , 阿瑟·盖兹 , 西蒙·施密特 , 劳伦特·西弗雷 , 西奥芬妮·韦伯 , 大卫·西尔弗 , 哈多·范·哈塞尔特 :
Muesli:结合策略优化方面的改进。 CoRR公司 abs/2104.06159 ( 2021 ) 【i24】 马特奥·赫塞尔 , 曼纽尔·克罗伊斯 , 艾丹·克拉克 , 尤里·凯马耶夫 , 约翰·泉 , 托马斯·凯克 , 法比奥·维奥拉 , 哈多·范·哈塞尔特 :
用于可扩展强化学习的Podracer架构。 CoRR公司 abs/2104.06272 ( 2021 ) [第23条] 雷·江 , 汤姆·扎哈维 , 徐忠文 , 亚当·怀特 , 马特奥·赫塞尔 , 查尔斯·布伦德尔 , 哈多·范·哈塞尔特 :
深度强化学习的重点算法。 CoRR公司 abs/2106.11779 ( 2021 ) [i22] 格雷戈里·法夸尔 , 凯特·鲍姆利 , 齐塔·马里尼奥 , 安吉洛斯·菲洛斯 , 马特奥·赫塞尔 , 哈多·范·哈塞尔特 , 大卫·西尔弗 :
自我一致的模型和价值观。 CoRR公司 abs/2110.12840 ( 2021 ) 2020 [第19条] 伊恩·奥斯班德 , 约塔姆·多隆 , 马特奥·赫塞尔 , 约翰·阿斯兰尼德斯 , 埃伦·塞泽纳 , 安德烈·萨拉瓦 , 卡特里娜·麦金尼 , 托拉蒂莫尔 , Csaba Szepesvariá , 萨汀德·辛格 , 本杰明·范罗伊 , 理查德·萨顿 , 大卫·西尔弗 , 哈多·范·哈塞尔特 :
强化学习行为套件。 ICLR公司 2020 [第18条] 西蒙·施密特 , 马特奥·赫塞尔 , 凯伦·西蒙扬 :
非政策演员评论与共享经验重播。 ICML公司 2020 : 8545-8554 [第17条] 郑泽瑜 , Junhyuk噢 , 马特奥·赫塞尔 , 徐忠文 , 曼纽尔·克罗伊斯 , 哈多·范·哈塞尔特 , 大卫·西尔弗 , 萨汀德·辛格 :
学习到的内在奖励能捕捉到什么? ICML公司 2020 : 11436-11446 [第16条] Junhyuk噢 , 马特奥·赫塞尔 , 沃伊切赫·M·恰尔内茨基 , 徐忠文 , 哈多·范·哈塞尔特 , 萨汀德·辛格 , 大卫·西尔弗 :
发现强化学习算法。 NeurIPS公司 2020 [第15条] 徐忠文 , 哈多·菲利普·范·哈塞尔特 , 马特奥·赫塞尔 , Junhyuk噢 , 萨汀德·辛格 , 大卫·西尔弗 :
在线发现目标的元梯度强化学习。 NeurIPS公司 2020 [第14条] 汤姆·扎哈维 , 徐忠文 , 维韦克·韦利亚 , 马特奥·赫塞尔 , Junhyuk噢 , 哈多·范·哈塞尔特 , 大卫·西尔弗 , 萨汀德·辛格 :
一个自我调整的演员-评论家算法。 NeurIPS公司 2020 【i21】 汤姆·扎哈维 , 徐忠文 , 维维克·维里亚 , 马特奥·赫塞尔 , Junhyuk噢 , 哈多·范·哈塞尔特 , 大卫·西尔弗 , 萨汀德·辛格 :
自我调节深度强化学习。 CoRR公司 abs/2002.12928 ( 2020 ) [i20] 哈多·范·哈塞尔特 , 丝芙兰Madjiheurem , 马特奥·赫塞尔 , 大卫·西尔弗 , 安德烈·巴雷托 , 戴安娜·博萨 :
预期合格跟踪。 CoRR公司 abs/2007.01839 ( 2020 ) [i19] 徐忠文 , 哈多·范·哈塞尔特 , 马特奥·赫塞尔 , Junhyuk噢 , 萨汀德·辛格 , 大卫·西尔弗 :
在线发现目标的元梯度强化学习。 CoRR公司 abs/2007.08433 ( 2020 ) [i18] Junhyuk噢 , 马特奥·赫塞尔 , 沃伊切赫·M·恰尔内茨基 , 徐忠文 , 哈多·范·哈塞尔特 , 萨汀德·辛格 , 大卫·西尔弗 :
发现强化学习算法。 CoRR公司 abs/2007.08794 ( 2020 )
2010 – 2019
2019 [第13条] 马特奥·赫塞尔 , 休伯特·索耶 , 拉斯·埃斯佩霍尔特 , 沃伊切赫·沙内基(Wojciech Czarnecki) , 西蒙·施密特 , 哈多·范·哈塞尔特 :
PopArt的多任务深度强化学习。 AAAI公司 2019 : 3796-3803 [第12条] 维维克·维里亚 , 马特奥·赫塞尔 , 徐忠文 , 贾纳瑟南·拉金德兰 , 理查德·刘易斯 , Junhyuk噢 , 哈多·范·哈塞尔特 , 大卫·西尔弗 , 萨汀德·辛格 :
发现有用的问题作为辅助任务。 NeurIPS公司 2019 : 9306-9317 [第11条] 哈多·范·哈塞尔特 , 马特奥·赫塞尔 , 约翰·阿斯兰尼德斯 :
何时在强化学习中使用参数模型? NeurIPS公司 2019 : 14322-14333 [i17] 安德烈·巴雷托 , 戴安娜·博萨 , 约翰·泉 , 汤姆·绍尔 , 大卫·西尔弗 , 马特奥·赫塞尔 , 丹尼尔·曼科维茨 , 奥古斯汀·泽德克 , 雷米·穆诺斯 :
利用继任者特征和一般政策改进进行深度强化学习。 CoRR公司 abs/1901.10964 ( 2019 ) [i16] 哈多·范·哈塞尔特 , 马特奥·赫塞尔 , 约翰·阿斯兰尼德斯 :
何时在强化学习中使用参数模型? CoRR公司 abs/1906.05243 ( 2019 ) 【i15】 马特奥·赫塞尔 , 哈多·范·哈塞尔特 , 约瑟夫·莫达伊尔 , 大卫·西尔弗 :
深度强化学习中的归纳偏差。 CoRR公司 abs/1907.02908 ( 2019 ) [第14条] 哈多·范·哈塞尔特 , 约翰·泉 , 马特奥·赫塞尔 , 徐忠文 , 戴安娜·博萨 , 安德烈·巴雷托 :
一般非线性Bellman方程。 CoRR公司 abs/1907.03687 ( 2019 ) [i13] 伊恩·奥斯班德 , 约塔姆·多隆 , 马特奥·赫塞尔 , 约翰·阿斯兰尼德斯 , 埃伦·塞泽纳 , 安德烈·萨拉瓦 , 卡特琳娜·麦金尼 , 托拉蒂莫尔 , Csaba Szepesvariá , 萨汀德·辛格 , 本杰明·范罗伊 , 理查德·萨顿 , 大卫·西尔弗 , 哈多·范·哈塞尔特 :
强化学习行为套件。 CoRR公司 abs/1908.03568 ( 2019 ) [i12] 维维克·维里亚 , 马特奥·赫塞尔 , 徐忠文 , 理查德·刘易斯 , Janarthanan Rajendran公司 , Junhyuk噢 , 哈多·范·哈塞尔特 , 大卫·西尔弗 , 萨汀德·辛格 :
发现有用的问题作为辅助任务。 CoRR公司 abs/1909.04607 ( 2019 ) [i11] 西蒙·施密特 , 马特奥·赫塞尔 , 凯伦·西蒙扬 :
非政策演员评论与共享经验重播。 CoRR公司 腹肌/190911583 ( 2019 ) [i10] 郑泽瑜 , Junhyuk噢 , 马特奥·赫塞尔 , 徐忠文 , 曼纽尔·克罗伊斯 , 哈多·范·哈塞尔特 , 大卫·西尔弗 , 萨汀德·辛格 :
学习到的内在奖励能捕捉到什么? CoRR公司 abs/1912.05500 ( 2019 ) 2018 [c10] 马特奥·赫塞尔 , 约瑟夫·莫达伊尔 , 哈多·范·哈塞尔特 , 汤姆·绍尔 , 乔治·奥斯特罗夫斯基 , 威尔·达布尼 , 丹·霍根 , 比拉尔·皮奥 , 穆罕默德·盖什拉希·阿扎尔 , 大卫·西尔弗 :
彩虹:结合深度强化学习的改进。 AAAI公司 2018 : 3215-3222 【c9】 迈尔·福图纳托 , 穆罕默德·盖什拉希·阿扎尔 , 比拉尔·皮奥 , 雅各布·梅尼克 , 马特奥·赫塞尔 , 伊恩·奥斯班德 , 亚历克斯·格拉夫斯 , 沃洛德米尔·姆尼赫 , 雷米·穆诺斯 , 哈萨比斯 , 奥利维尔·皮特金 , 查尔斯·布伦德尔 , 谢恩·莱格 :
探索的嘈杂网络。 ICLR(海报) 2018 【c8】 丹·霍根 , 约翰·泉 , 大卫·布登 , 加布里埃尔·巴特·马龙 , 马特奥·赫塞尔 , 哈多·范·哈塞尔特 , 大卫·西尔弗 :
分布式优先体验重播。 ICLR(海报) 2018 【c7】 安德烈·巴雷托 , 戴安娜·博萨 , 约翰·泉 , 汤姆·绍尔 , 大卫·西尔弗 , 马特奥·赫塞尔 , 丹尼尔·曼科维茨 , 奥古斯汀·泽德克 , 雷米·穆诺斯 :
利用继任者特征和一般政策改进进行深度强化学习。 ICML公司 2018 : 510-519 [第九章] 丹尼尔·曼科维茨 , 奥古斯汀·泽德克 , 安德烈·巴雷托 , 丹·霍根 , 马特奥·赫塞尔 , 约翰·泉 , Junhyuk噢 , 哈多·范·哈塞尔特 , 大卫·西尔弗 , 汤姆·绍尔 :
独角兽:与通用非政策代理一起持续学习。 CoRR公司 abs/1802.08294 ( 2018 ) [i8] 丹·霍根 , 约翰·泉 , 大卫·布登 , 加布里埃尔·巴特·马龙 , 马特奥·赫塞尔 , 哈多·范·哈塞尔特 , 大卫·西尔弗 :
分布式优先体验重播。 CoRR公司 abs/1803.00933 ( 2018 ) [i7] 托比亚斯·波伦 , 比拉尔·皮奥 , 托德·海丝特 , 穆罕默德·盖什拉希·阿扎尔 , 丹·霍根 , 大卫·布登 , 加布里埃尔·巴特·马龙 , 哈多·范·哈塞尔特 , 约翰·泉 , 梅尔·韦塞克 , 马特奥·赫塞尔 , 雷米·穆诺斯 , 奥利维尔·皮特金 :
观察并进一步观察:在Atari上实现一致的性能。 CoRR公司 abs/1805.11593 ( 2018 ) [i6] 马特奥·赫塞尔 , 休伯特·索耶 , 拉斯·埃斯佩霍尔特 , 沃伊切赫·沙内基(Wojciech Czarnecki) , 西蒙·施密特 , 哈多·范·哈塞尔特 :
PopArt的多任务深度强化学习。 CoRR公司 abs/1809.04474 ( 2018 ) [i5] 哈多·范·哈塞尔特 , 约塔姆·多隆 , 弗洛里安·斯特鲁布 , 马特奥·赫塞尔 , 尼古拉斯·桑纳雷特 , 约瑟夫·莫达伊尔 :
深度强化学习和致命三合会。 CoRR公司 abs/1812.02648 ( 2018 ) [i4] Miljan Martic公司 , 简·雷克 , 安德鲁·特拉斯克 , 马特奥·赫塞尔 , 谢恩·莱格 , Pushmet Kohli公司 :
通过模型拆分扩展共享模型治理。 CoRR公司 abs/1812.05979 ( 2018 ) 2017 【c6】 大卫·西尔弗 , 哈多·范·哈塞尔特 , 马特奥·赫塞尔 , 汤姆·绍尔 , 阿瑟·盖兹 , 蒂姆·哈雷 , 加布里埃尔·杜拉克-阿诺德 , David P.Reichert(大卫·雷切尔) , 尼尔·C·拉比诺维茨 , 安德烈·巴雷托 , 托马斯·迪吉斯 :
预测:端到端的学习和规划。 ICML公司 2017 : 3191-3199 [i3] 马特奥·赫塞尔 , 约瑟夫·莫达伊尔 , 哈多·范·哈塞尔特 , 汤姆·绍尔 , 乔治·奥斯特罗夫斯基 , 威尔·达布尼 , 丹尼尔·霍根 , 比拉尔·皮奥 , 穆罕默德·盖什拉希·阿扎尔 , 大卫·西尔弗 :
彩虹:结合深度强化学习的改进。 CoRR公司 abs/1710.02298 ( 2017 ) 2016 【c5】 王子玉 , 汤姆·绍尔 , 马特奥·赫塞尔 , 哈多·范·哈塞尔特 , 马克·兰科特 , 南多·德·弗雷塔斯 :
深入强化学习的决斗网络架构。 ICML公司 2016 : 1995-2003 【c4】 哈多·范·哈塞尔特 , 阿瑟·盖兹 , 马特奥·赫塞尔 , 沃洛德米尔·姆尼赫 , 大卫·西尔弗 :
学习跨越多个数量级的价值观。 NIPS公司 2016 : 4287-4295 [i2] 哈多·范·哈塞尔特 , 阿瑟·盖兹 , 马特奥·赫塞尔 , 大卫·西尔弗 :
学习跨越多个数量级的函数。 CoRR公司 abs/1602.07714 ( 2016 ) [i1] 大卫·西尔弗 , 哈多·范·哈塞尔特 , 马特奥·赫塞尔 , 汤姆·绍尔 , 阿瑟·盖兹 , 蒂姆·哈雷 , 加布里埃尔·杜拉克-阿诺德 , David P.Reichert(大卫·雷切尔) , 尼尔·C·拉比诺维茨 , 安德烈·巴雷托 , 托马斯·迪吉斯 :
预测:端到端的学习和规划。 CoRR公司 abs/1612.08810 ( 2016 ) 2014 【c3】 马特奥·赫塞尔 , 法比奥·奥尔塔利 , 弗朗西斯科·博尔盖特利 :
计算机模拟中参数筛选的机器学习。 MESAS公司 2014 : 308-320 【c2】 马特奥·赫塞尔 , 弗朗西斯科·博尔盖特利 , 法比奥·奥尔塔利 :
一种通过自动参数筛选和优化理论进行模型设计和调整的新方法,并应用于直升机飞行模拟器案例研究。 SIMULTECH公司 2014 : 24-35 【c1】 马特奥·赫塞尔 , 法比奥·奥尔塔利 , 弗朗西斯科·博尔盖特利 , 皮尔·卢卡·兰齐 :
计算模型的自动调整。 SIMULTECH(论文集) 2014 : 43-64