马修·霍斯克内克
人员信息
SPARQL查询
优化列表
2020年–今天
2023 [公元25年] 纳撒尼尔堰 , 兴地园 , 马克·阿莱克安德烈·科特 , 马修·霍斯克内克 , 罗曼·拉罗什 , 艾达·莫门内贾德 , 哈姆·范·塞扬 , 本杰明·范·杜姆 :
用层次潜在语言从演示中一次性学习。 美国原子能机构 2023 : 2388-2390 2022 [公元24年] 迈卡·卡罗尔 , 奥尔天堂 , 杰西·林 , 罗卢卡·乔治斯库 , 孙明飞 , 大卫·比格内尔 , 斯蒂芬妮·米拉尼 , 卡贾·霍夫曼 , 马修·霍斯克内克 , 安卡·D·德拉甘 , 萨姆·德夫林 :
Uni[MASK]:序列决策问题中的统一推理。 NeurIPS公司 2022 【c23】 诺兰·瓦格纳 , 安德烈·科洛波夫 , 菲利佩·维埃拉·弗鲁杰里 , 里基·洛因德 , 程安成 , 马修·霍斯克内克 :
MoCapAct:模拟仿人控制的多任务数据集。 NeurIPS公司 2022 【i24】 马修·霍斯克内克 , 诺兰·瓦格纳 :
政策梯度强化学习持续退学。 CoRR公司 abs/2202.11818 ( 2022 ) [第23条] 纳撒尼尔堰 , 兴地园 , 马克·阿莱克安德烈·科特 , 马修·霍斯克内克 , 罗曼·拉罗什 , 艾达·莫门内贾德 , 哈姆·范·塞扬 , 本杰明·范·杜姆 :
用层次潜在语言从演示中一次性学习。 CoRR公司 abs/2203.04806 ( 2022 ) [i22] 米卡·卡罗尔 , 杰西·林 , 奥尔天堂 , 罗卢卡·乔治斯库 , 孙明飞 , 大卫·比格内尔 , 斯蒂芬妮·米拉尼 , 卡贾·霍夫曼 , 马修·霍斯克内克 , 安卡·D·德拉甘 , 萨姆·德夫林 :
通过双向变换实现序列决策问题的灵活推理。 CoRR公司 abs/2204.13326 ( 2022 ) 【i21】 诺兰·瓦格纳 , 安德烈·科洛波夫 , 菲利佩·维埃拉·弗鲁杰里 , 里基·洛因德 , 程安成 , 马修·霍斯克内克 :
MoCapAct:模拟仿人控制的多任务数据集。 CoRR公司 abs/2208.07363 ( 2022 ) [i20] 迈卡·卡罗尔 , 奥尔天堂 , 杰西·林 , 罗卢卡·乔治斯库 , 孙明飞 , 大卫·比格内尔 , 斯蒂芬妮·米拉尼 , 卡贾·霍夫曼 , 马修·霍斯克内克 , 安卡·D·德拉甘 , 萨姆·德夫林 :
UniMASK:序列决策问题中的统一推理。 CoRR公司 abs/2211.10869 ( 2022 ) 2021 [公元22年] 莫希特·施里达尔 , 兴地园 , 马克·阿莱克安德烈·科特 , 约纳坦·比斯克 , 亚当·特里施勒 , 马修·霍斯克内克 :
ALFWorld:为交互式学习调整文本和具体环境。 ICLR公司 2021 【c21】 姚顺玉 , Karthik Narasimhan公司 , 马修·霍斯克内克 :
盲目阅读和行动:文本游戏代理对语义的需求。 NAACL-HLT公司 2021 : 3097-3102 [i19] 姚顺玉 , Karthik Narasimhan公司 , 马修·霍斯克内克 :
盲目阅读和行动:文本游戏代理对语义的需求。 CoRR公司 abs/2103.13552 ( 2021 ) [i18] 莎拉达·莫汉蒂 , Jyotish Poonganam(约提什·蓬加南) , 阿德里安·盖登 , 安德烈·科洛波夫 , 布莱克·沃尔夫 , Dipam Chakraborty公司 , Grazvydas Semetulskis公司 , 乔·夏普克 , 乔纳斯·库比利乌斯 , 尤吉斯·帕苏科尼斯 , 利纳斯·克里马斯 , 马修·霍斯克内克 , 帕特里克·麦克阿尔宾 , Quang Nhat Tran公司 , 托马斯·图米埃尔 , 小城汤 , 陈新伟 , 克里斯托弗·黑塞 , 雅各布·希尔顿 , 威廉·赫布根·格斯 , Sahika基因 , 约翰·舒尔曼 , 卡尔·科布 :
测量强化学习基准中的样本效率和泛化:NeurIPS 2020 Procgen基准。 CoRR公司 abs/2103.15332 ( 2021 ) 2020 [公元20年] 马修·霍斯克内克 , 阿马纳布罗Prithviraj , 马克·阿莱克安德烈·科特 , 兴地园 :
互动小说游戏:一次巨大的冒险。 AAAI公司 2020 : 7903-7910 [第19条] 姚顺玉 , 罗汉·饶 , 马修·霍斯克内克 , Karthik Narasimhan公司 :
保持CALM并探索:基于文本的游戏中动作生成的语言模型。 EMNLP(1) 2020 : 8736-8754 [第18条] 阿马纳布罗Prithviraj , 马修·霍斯克内克 :
自然语言动作空间的图约束强化学习。 ICLR公司 2020 [第17条] 里基·洛因德 , 罗兰·费尔南德斯 , 阿斯利·塞利基尔马兹 , 阿迪思·斯瓦米纳坦 , 马修·霍斯克内克 :
工作记忆图。 ICML公司 2020 : 6404-6414 [第16条] 埃里克·詹 , 曾荫权(Albert Tseng) , 易松岳 , 阿迪思·斯瓦米纳坦 , 马修·霍斯克内克 :
使用编程风格一致性学习可校准策略。 ICML公司 2020 : 11001-11011 [第15条] 莎拉达·莫汉蒂 , Jyotish Poonganam(约提什·蓬加南) , 阿德里安·盖登 , 安德烈·科洛波夫 , 布雷克·伍尔夫 , Dipam Chakraborty公司 , Grazvydas Semetulskis公司 , 乔·夏普克 , 乔纳斯·库比利乌斯 , 尤吉斯·帕苏科尼斯 , 利纳斯·克里马斯 , 马修·霍斯克内克 , 帕特里克·麦克阿尔宾 , Quang Nhat Tran公司 , 托马斯·图米埃尔 , 小城汤 , 陈新伟(Xinwei Chen) , 克里斯托弗·黑塞 , 雅各布·希尔顿 , 威廉·赫布根·格斯 , Sahika基因 , 约翰·舒尔曼 , 卡尔·科布 :
测量强化学习基准中的样本效率和泛化:NeurIPS 2020 Procgen基准。 NeurIPS(竞争和演示) 2020 : 361-395 [i17] 阿马纳布罗Prithviraj , 马修·霍斯克内克 :
自然语言动作空间的图形约束强化学习。 CoRR公司 abs/2001.08837 ( 2020 ) [i16] 阿马纳布罗Prithviraj , 伊桑·田 , 马修·霍斯克内克 , 马克·里德尔 :
如何避免被愤怒吞噬:文本世界的结构化探索策略。 CoRR公司 abs/2006.07409 ( 2020 ) 【i15】 姚顺玉 , 罗汉·饶 , 马修·霍斯克内克 , Karthik Narasimhan公司 :
保持CALM并探索:基于文本的游戏中动作生成的语言模型。 CoRR公司 abs/2010.02903 ( 2020 ) [第14条] 莫希特·施里达尔 , 兴地园 , 马克·阿莱克安德烈·科特 , 约纳坦·比斯克 , 亚当·特里施勒 , 马修·霍斯克内克 :
ALFWorld:为交互式学习调整文本和具体环境。 CoRR公司 abs/2010.03768 ( 2020 )
2010 – 2019
2019 [第14条] 杰克·W·斯托克斯 , Rakshit Agrawal公司 , 杰夫·麦克唐纳 , 马修·霍斯克内克 :
ScriptNet:恶意JavaScript检测的神经静态分析。 军事通信 2019 : 1-8 [i13] 马修·霍斯克内克 , 里基·洛因德 , 格雷格·杨 , 阿迪思·斯瓦米纳坦 , 杰森·威廉姆斯 :
NAIL:通用互动小说代理。 CoRR公司 腹肌/1902.04259 ( 2019 ) [i12] 杰克·W·斯托克斯 , Rakshit Agrawal公司 , 杰夫·麦克唐纳 , 马修·霍斯克内克 :
ScriptNet:恶意JavaScript检测的神经静态分析。 CoRR公司 abs/1904.01126 ( 2019 ) [i11] 伊珊·杜鲁加尔 , 马修·霍斯克内克 , 阿迪思·斯瓦米纳坦 , 帕特里克·麦克阿尔宾 :
多选演员评论家。 CoRR公司 abs/1904.03295 ( 2019 ) [i10] 马修·霍斯克内克 , 阿马纳布罗Prithviraj , 马克·阿莱克安德烈·科特 , 兴地园 :
互动小说游戏:一次巨大的冒险。 CoRR公司 abs/1909.05398 ( 2019 ) [第九章] 埃里克·詹 , 曾荫权(Albert Tseng) , 易松岳 , 阿迪思·斯瓦米纳坦 , 马修·霍斯克内克 :
使用编程风格一致性学习可校准策略。 CoRR公司 abs/1910.01179 ( 2019 ) [i8] 里基·洛因德 , 罗兰·费尔南德斯 , 阿斯利塞利基伊尔马兹 , 阿迪思·斯瓦米纳坦 , 马修·霍斯克内克 :
工作记忆图表。 CoRR公司 abs/1911.07141 ( 2019 ) 2018 【j4】 马洛斯·马查多 , 马克·贝勒马尔 , 埃里克·塔尔维蒂 , 乔尔·维内斯 , 马修·霍斯克内克 , 迈克尔·鲍林 :
重温街机学习环境:普通代理的评估协议和开放问题。 J.阿蒂夫。 智力。 物件。 61 : 523-562 ( 2018 ) [c13] 鲁迪·本内尔 , 马修·霍斯克内克 , 雅各布·德夫林 , 里沙布·辛格 , Pushmet Kohli公司 :
利用语法和强化学习进行神经程序合成。 ICLR(海报) 2018 [第12条] 马克·阿莱克安德烈·科特 , 阿尔科斯·卡达尔 , 兴地园 , 本·克巴塔斯 , 塔维安·巴恩斯 , 金刚砂细 , 詹姆斯·摩尔 , 马修·霍斯克内克 , 拉伊拉·艾尔·阿斯里 , 马哈茂德·阿达达 , 温迪·泰 , 亚当·特里施勒 :
文本世界:基于文本的游戏的学习环境。 IJCAI的CGW 2018 : 41-75 [第11条] 马洛斯·马查多 , 马克·贝勒马尔 , 埃里克·塔尔维蒂 , 乔尔·维内斯 , 马修·霍斯克内克 , 迈克尔·鲍林 :
重温街机学习环境:通用代理的评估协议和开放问题(扩展摘要)。 国际JCAI 2018 : 5573-5577 [i7] 鲁迪·本内尔 , 马修·霍斯克内克 , 雅各布·德夫林 , 里沙布·辛格 , Pushmet Kohli公司 :
利用语法和强化学习进行神经程序合成。 CoRR公司 abs/1805.04276 ( 2018 ) [i6] 兴地园 , 马克·阿莱克安德烈·科特 , 亚历山德罗·索多尼 , 罗曼·拉罗什 , Remi Tachet des Combes公司 , 马修·霍斯克内克 , 亚当·特里施勒 :
在基于文本的游戏中进行计数以探索和概括。 CoRR公司 abs/1806.11525 ( 2018 ) [i5] 马克·阿莱克安德烈·科特 , 阿尔科斯·卡达尔 , 兴地园 , 本·克巴塔斯 , 塔维安·巴恩斯 , 金刚砂细 , 詹姆斯·摩尔 , 马修·霍斯克内克 , 拉伊拉·艾尔·阿斯里 , 马哈茂德·阿达达 , 温迪·泰 , 亚当·特里施勒 :
文本世界:一个基于文本的游戏学习环境。 CoRR公司 abs/1806.11532 ( 2018 ) 2017 [j3] 马修·霍斯克内克 , 李文科 , 迈克尔·D·莫克 , 斯通 :
模拟小脑的机器学习能力。 IEEE传输。 神经网络学习。 系统。 28 ( 三 ) : 510-522 ( 2017 ) [第10条] 雅各布·德夫林 , 鲁迪·本内尔 , 里沙布·辛格 , 马修·霍斯克内克 , Pushmet Kohli公司 :
神经程序Meta-Induction。 NIPS公司 2017 : 2080-2088 [i4] 马洛斯·马查多 , 马克·贝勒马尔 , 埃里克·塔尔维蒂 , 乔尔·维内斯 , 马修·霍斯克内克 , 迈克尔·鲍林 :
重温街机学习环境:普通代理的评估协议和开放问题。 CoRR公司 abs/1709.06009 ( 2017 ) [i3] 雅各布·德夫林 , 鲁迪·本内尔 , 里沙布·辛格 , 马修·霍斯克内克 , Pushmet Kohli公司 :
神经程序Meta-Induction。 CoRR公司 abs/1710.04157 ( 2017 ) 2016 【c9】 马修·霍斯克内克 , 斯通 :
参数化动作空间中的深度强化学习。 ICLR(海报) 2016 2015 [c8] 马修·霍斯克内克 , 斯通 :
决定论对学习Atari 2600游戏的影响。 AAAI工作坊:学习电子游戏中的一般能力 2015 【c7】 马修·霍斯克内克 , 斯通 :
部分可观测MDP的深度递归Q学习。 AAAI秋季研讨会 2015 : 29-37 【c6】 Joe Yue-Hei Ng , 马修·霍斯克内克 , Sudheendra Vijayanarasimhan先生 , Oriol葡萄酒 , 拉贾特·蒙加 , 乔治·托德里奇 :
超越短片:视频分类的深层网络。 CVPR公司 2015 : 4694-4702 [i2] Joe Yue-Hei Ng , 马修·霍斯克内克 , Sudheendra Vijayanarasimhan先生 , Oriol葡萄酒 , 拉贾特·蒙加 , 乔治·托德里奇 :
超越短片:视频分类的深层网络。 CoRR公司 abs/1503.08909 ( 2015 ) [i1] 马修·霍斯克内克 , 斯通 :
部分可观测MDP的深度递归Q学习。 CoRR公司 abs/1507.06527 ( 2015 ) 2014 [注2] 马修·霍斯克内克 , 乔尔·雷曼 , 里斯托·米库莱宁 , 斯通 :
通用Atari游戏的神经进化方法。 IEEE传输。 计算。 智力。 人工智能游戏 6 ( 4 ) : 355-366 ( 2014 ) 2013 [j1] 李文科 , 马修·霍斯克内克 , 斯通 , 迈克尔·D·莫克 :
使用小脑的百万细胞模拟:网络缩放和任务通用性。 神经网络 47 : 95-102 ( 2013 ) 2012 【c5】 马修·霍斯克内克 , 皮尤什·坎德尔瓦尔 , 瑞斯托·米伊库莱宁 , 斯通 :
HyperNEAT GGP:一款基于HyperNEAT的atari通用游戏玩家。 GECCO公司 2012 : 217-224 2011 【c4】 马修·霍斯克内克 , Tsz-Chiu Au公司 , 斯通 :
自主交叉口管理:多交叉口优化。 IROS公司 2011 : 4581-4586 【c3】 马修·霍斯克内克 , Tsz-Chiu Au公司 , 斯通 , 大卫·法贾多 , S.Travis Waller(特拉维斯·沃勒) :
交通管理中的动态车道反转。 ITSC公司 2011 : 1929-1934 2010 【c2】 马修·霍斯克内克 , 斯通 :
学习Aibo ERS-7的强力踢球:寻找前锋。 机器人世界杯足球锦标赛 2010 : 254-265
2000 – 2009
2009 【c1】 丁伟 , 马修·霍斯克内克 , 黄寿勋 , 扎克·里格尔 :
使用长连接链检测阶梯式入侵者。 国际会计准则 2009 : 665-669