格雷格·韦恩
人员信息
其他同名人员
罗伯特·韦恩·格雷戈里 (又名:罗伯特·格雷戈里 0001 ) — 弗吉尼亚大学麦金泰尔商学院,弗吉尼亚州夏洛茨维尔,美国 (还有2个以上)
SPARQL查询
优化列表
2020年–今天
2023 [第18条] 亚历山大·穆勒曼斯 , 西蒙·舒格 , 小林精(Seijin Kobayashi) , 纳撒尼尔·道 , 格雷戈里·韦恩 :
我会得到那个奖励吗? 通过反事实贡献分析进行长期信贷分配。 NeurIPS公司 2023 [i34] 亚历山大·迈勒曼斯 , 西蒙·舒格 , 小林精(Seijin Kobayashi) , 纳撒尼尔·道 , 格雷戈里·韦恩 :
我会得到那个奖励吗? 通过反事实贡献分析进行长期信贷分配。 CoRR公司 abs/2306.16803 ( 2023 ) 2022 [第17条] 陈燕 , 费德里科狂欢节 , 佩特科·乔治耶夫 , 亚当·桑托罗 , 奥雷莉亚·盖伊 , 阿利斯泰尔·穆达尔 , Chia-Chun Hung先生 , 艾布拉森 , 蒂莫西·利利克拉普 , 格雷戈里·韦恩 :
代理内语音允许零快照任务获取。 NeurIPS公司 2022 [i33] 艾布拉森 , 阿伦·阿胡贾 , 费德里科狂欢节 , 佩特科·乔治耶夫 , 亚历克斯·戈尔丁 , 奥尔登·洪 , 杰西卡·兰登 , 蒂莫西·利利克拉普 , 阿利斯泰尔·穆达尔 , 布莱克·A·理查兹 , 亚当·桑托罗 , 塔玛拉·冯·格伦 , 格雷格·韦恩 , 纳撒尼尔·王 , 陈燕 :
评估多模式交互代理。 CoRR公司 abs/2205.13274 ( 2022 ) [i32] 陈燕 , 费德里科狂欢节 , 佩特科·乔治耶夫 , 亚当·桑托罗 , 奥雷莉亚·盖伊 , 阿利斯泰尔·穆达尔 , Chia-Chun Hung先生 , 艾布拉森 , 蒂莫西·利利克拉普 , 格雷戈里·韦恩 :
代理内语音允许零快照任务获取。 CoRR公司 abs/2206.03139 ( 2022 ) [i31] 艾布拉森 , 阿伦·阿胡贾 , 费德里科狂欢节 , 佩特科·乔治耶夫 , 亚历克斯·戈尔丁 , 奥尔登·洪 , 杰西卡·兰登 , 吉尔卡·洛特卡 , 蒂莫西·利利克拉普 , 阿利斯泰尔·穆达尔 , 乔治·鲍威尔 , 亚当·桑托罗 , 盖伊·斯卡利 , 桑贾娜·斯利瓦斯塔瓦 , 塔玛拉·冯·格伦 , 格雷格·韦恩 , 纳撒尼尔·王 , 陈燕 , 朱瑞(Rui Zhu) :
通过从人的反馈中强化学习来改进多模态交互代理。 CoRR公司 abs/2211.11602 ( 2022 ) 2021 [第16条] 安德鲁·贾格尔 , 尤里·苏尔斯基 , 阿伦·阿胡贾 , 杰克·布鲁斯 , 罗布·弗格斯 , 格雷格·韦恩 :
通过预测观测进行模拟。 ICML公司 2021 : 4665-4676 [i30] 大卫·拉波索 , 塞缪尔·里特 , 亚当·桑托罗 , 格雷格·韦恩 , 西奥芬妮·韦伯 , 马特·博特维尼克 , 哈多·范·哈塞尔特 , H.弗朗西斯·宋 :
长期信贷分配的综合回报。 CoRR公司 abs/2102.12425 ( 2021 ) [i29] 安德鲁·杰格尔 , 尤里·苏尔斯基 , 阿伦·阿胡贾 , 杰克·布鲁斯 , 罗布·弗格斯 , 格雷格·韦恩 :
通过预测观测进行模拟。 CoRR公司 abs/2107.03851 ( 2021 ) [第28条] 艾布拉森 , 阿伦·阿胡贾 , 阿瑟·布鲁西 , 费德里科狂欢节 , 玛丽·卡辛 , 费利克斯·菲舍尔 , 佩特科·乔治耶夫 , 亚历克斯·戈尔丁 , 蒂姆·哈雷 , 费利克斯·希尔 , 彼得·康威·汉弗莱斯 , 奥尔登·洪 , 杰西卡·兰登 , 蒂莫西·利利克拉普 , 哈姆扎·梅尔齐克 , 阿利斯泰尔·穆达尔 , 亚当·桑托罗 , 盖伊·斯卡利 , 塔玛拉·冯·格伦 , 格雷格·韦恩 , 纳撒尼尔·王 , 陈燕 , 朱瑞(Rui Zhu) :
通过模仿和自我监督学习创建多模式交互代理。 CoRR公司 腹肌/2112.03763 ( 2021 ) 2020 [j5] 乔什·梅雷尔 , Saran Tunyasuvunakool公司 , 阿伦·阿胡贾 , 尤瓦尔·塔萨 , 伦纳德·哈森克韦尔 , Vu Pham公司 , 汤姆·埃雷斯 , 格雷格·韦恩 , 尼古拉斯·希斯 :
接送:视觉引导全身任务的可重用神经控制器。 ACM事务处理。 图表。 39 ( 4 ) : 39 ( 2020 ) [第15条] 乔什·梅雷尔 , 迭戈·阿尔达隆多 , 杰西·马歇尔 , 尤瓦尔·塔萨 , 格雷格·韦恩 , 本斯·奥尔维茨基 :
虚拟啮齿动物的深层神经行为学。 ICLR公司 2020 [第14条] 阿披实达斯 , 费德里科狂欢节 , 哈姆扎·梅尔齐克 , 劳拉·里梅尔 , 罗莎莉亚·施耐德 , 艾布拉森 , 奥尔登·洪 , 阿伦·阿胡贾 , 祈立德 , 格雷格·韦恩 , 费利克斯·希尔 :
通过问答探索预测代理中的涌现语义。 ICML公司 2020 : 2376-2391 [第13条] 大卫·布登 , 亚当·H·大理石 , 埃伦·塞泽纳 , 托拉蒂莫尔 , 格雷戈里·韦恩 , 乔尔·维内斯 :
高斯门线性网络。 NeurIPS公司 2020 [i27] 亚当·H·大理石 , 吴彦(Yan Wu) , 格雷格·韦恩 :
产品Kanerva机器:分解贝叶斯记忆。 CoRR公司 abs/2002.02385 ( 2020 ) [i26] 阿披实达斯 , 费德里科狂欢节 , 哈姆扎·梅尔齐克 , 劳拉·里梅尔 , 罗莎莉亚·施耐德 , 艾布拉森 , 奥尔登·洪 , 阿伦·阿胡贾 , 祈立德 , 格雷戈里·韦恩 , 费利克斯·希尔 :
通过问答探索预测代理中的涌现语义。 CoRR公司 abs/2006.01016 ( 2020 ) [i25] 大卫·布登 , 亚当·H·大理石 , 埃伦·塞泽纳 , 托拉蒂莫尔 , 格雷格·韦恩 , 乔尔·维内斯 :
高斯门线性网络。 CoRR公司 abs/2006.05964 ( 2020 ) 【i24】 艾布拉森 , 阿伦·阿胡贾 , 阿瑟·布鲁西 , 费德里科狂欢节 , 玛丽·卡辛 , 祈立德 , 安德鲁·杜季克 , 佩特科·乔治耶夫 , 奥雷莉亚·盖伊 , 蒂姆·哈雷 , 费利克斯·希尔 , 奥尔登·洪 , 扎卡里·肯顿 , 杰西卡·兰登 , 蒂莫西·利利克拉普 , 科里·W·马修森 , 阿利斯泰尔·穆达尔 , 亚当·桑托罗 , 尼古拉·萨维诺夫 , 维克兰·瓦尔马 , 格雷格·韦恩 , 纳撒尼尔·王 , 陈燕 , 朱瑞(Rui Zhu) :
模仿交互式智能。 CoRR公司 腹肌/2012.05672 ( 2020 )
2010 – 2019
2019 [第12条] 乔什·梅雷尔 , 阿伦·阿胡贾 , Vu Pham公司 , Saran Tunyasuvunakool公司 , 刘思奇 , 德鲁瓦·蒂鲁马拉 , 尼古拉斯·希斯 , 格雷格·韦恩 :
人形机器人的分级视觉运动控制。 ICLR(海报) 2019 [第11条] 乔什·梅雷尔 , 伦纳德·哈森克韦尔 , 亚历山大·加拉肖夫 , 阿伦·阿胡贾 , Vu Pham公司 , 格雷格·韦恩 , 叶惠德 , 尼古拉斯·希斯 :
用于仿人控制的神经概率运动原语。 ICLR(海报) 2019 [c10] 阿瑟·盖兹 , 梅赫迪·米尔扎 , 卡罗尔·格雷戈 , 里沙布·卡布拉 , 塞巴斯蒂安·拉卡尼埃 , 西奥芬妮·韦伯 , 大卫·拉波索 , 亚当·桑托罗 , 劳伦特·奥尔索 , 汤姆·埃克尔斯 , 格雷格·韦恩 , 大卫·西尔弗 , 蒂莫西·利利克拉普 :
无模型规划研究。 ICML公司 2019 : 2464-2473 【c9】 大卫·罗尔尼克 , 阿伦·阿胡贾 , 乔纳森·施瓦兹 , 蒂莫西·利利克拉普 , 格雷戈里·韦恩 :
持续学习的经验回放。 NeurIPS公司 2019 : 348-358 【c8】 本·德弗雷特 , 瑞恩·福克纳 , 迈尔·福图纳托 , 格雷戈里·韦恩 , 乔尔·雷波 :
深度强化学习代理的间隔时间。 NeurIPS公司 2019 : 6686-6695 【c7】 安娜·哈里顿扬(Anna Harutyunyan) , 威尔·达布尼 , 托马斯·梅斯纳德 , 穆罕默德·盖什拉希·阿扎尔 , 比拉尔·皮奥 , 尼古拉斯·希斯 , 哈多·范·哈塞尔特 , 格雷戈里·韦恩 , 萨汀德·辛格 , Doina Precup公司 , 雷米·穆诺斯 :
事后信用转让。 NeurIPS公司 2019 : 12467-12476 [第23条] 阿瑟·盖兹 , 梅赫迪·米尔扎 , 卡罗尔·格雷戈 , 里沙布·卡布拉 , 塞巴斯蒂安·拉卡尼埃 , 塞奥帕恩·韦伯(Théophane Weber) , 大卫·拉波索 , 亚当·桑托罗 , 劳伦特·奥尔索 , 汤姆·埃克尔斯 , 格雷格·韦恩 , 大卫·西尔弗 , 蒂莫西·利利克拉普 :
无模型规划研究。 CoRR公司 abs/1901.03559 ( 2019 ) [i22] 德鲁瓦·蒂鲁马拉 , 野贤武 , 亚历山大·加拉肖夫 , 伦纳德·哈森克韦尔 , 阿伦·阿胡贾 , 格雷格·韦恩 , 拉兹万·帕斯卡努 , 叶惠德 , 尼古拉斯·希斯 :
在KL规范化RL中开发学习和迁移层次。 CoRR公司 abs/1903.07438 ( 2019 ) 【i21】 本·德弗雷特 , 瑞恩·福克纳 , 迈尔·福图纳托 , 格雷格·韦恩 , 乔尔·雷波 :
深度强化学习代理的间隔时间。 CoRR公司 abs/1905.13469 ( 2019 ) [i20] 乔什·梅雷尔 , Saran Tunyasuvunakool公司 , 阿伦·阿胡贾 , 尤瓦尔·塔萨 , 伦纳德·哈森克韦尔 , 武法姆 , 汤姆·埃雷斯 , 格雷格·韦恩 , 尼古拉斯·希斯 :
可重复使用的神经技能嵌入,用于视觉引导的全身运动和物体操作。 CoRR公司 abs/1911.06636 ( 2019 ) [i19] 安娜·哈里顿扬(Anna Harutyunyan) , 威尔·达布尼 , 托马斯·梅斯纳德 , 穆罕默德·盖什拉希·阿扎尔 , 比拉尔·皮奥 , 尼古拉斯·希斯 , 哈多·范·哈塞尔特 , 格雷格·韦恩 , 萨汀德·辛格 , Doina Precup公司 , 雷米·穆诺斯 :
事后信用转让。 CoRR公司 腹肌/1912.02503 ( 2019 ) 2018 【j4】 安德烈亚·巴尼诺 , 卡斯韦尔·巴里 , 贝尼尼奥·乌里亚 , 查尔斯·布伦德尔 , 蒂莫西·利利克拉普 , 彼得·米洛夫斯基 , 亚历山大·普里策 , 马丁·查德威克 , 托马斯·迪吉斯 , 约瑟夫·莫达伊尔 , 格雷格·韦恩 , 休伯特·索耶 , 法比奥·维奥拉 , 布莱恩·张 , 罗斯·戈罗欣(Ross Goroshin) , 尼尔·C·拉比诺维茨 , 拉兹万·帕斯卡努 , 查理·比蒂 , 斯蒂格·彼得森 , 阿米尔·萨迪克 , 斯蒂芬·加夫尼 , 海伦·金 , Koray Kavukcuoglu公司 , 哈萨比斯 , Raia Hadsell公司 , 达山库马兰 :
在人工代理中使用类似网格表示的基于矢量的导航。 国家。 557 ( 7705 ) : 429-433 ( 2018 ) 【c6】 吴彦(Yan Wu) , 格雷格·韦恩 , 亚历克斯·格拉夫斯 , 蒂莫西·利利克拉普 :
Kanerva机器:一种生成分布式内存。 ICLR(海报) 2018 【c5】 吴彦(Yan Wu) , 格雷戈里·韦恩 , 卡罗尔·格雷戈 , 蒂莫西·利利克拉普 :
学习用于生成记忆的吸引子动力学。 NeurIPS公司 2018 : 9401-9410 [i18] 格雷格·韦恩 , Chia-Chun Hung先生 , 大卫·阿莫斯 , 梅赫迪·米尔扎 , 阿伦·阿胡贾 , 阿格尼什卡·格拉布斯卡·巴文斯卡 , 杰克·W·雷 , 彼得·米洛夫斯基 , 乔尔·雷波 , 亚当·桑托罗 , 梅夫拉娜·杰米奇 , 马尔科姆·雷诺兹 , 蒂姆·哈雷 , 艾布拉森 , 夏基尔·穆罕默德 , 丹尼尔·希梅内斯·雷泽德 , 大卫·萨克斯顿 , 亚当·凯恩 , 克洛伊·希利尔 , 大卫·西尔弗 , Koray Kavukcuoglu公司 , 马修·博特维尼克 , 哈萨比斯 , 蒂莫西·利利克拉普 :
目标导向代理中的无监督预测内存。 CoRR公司 abs/1803.10760 ( 2018 ) [i17] 路易斯·皮洛托 , 阿里·温斯坦 , 德鲁瓦结核 , 阿伦·阿胡贾 , 梅赫迪·米尔扎 , 格雷格·韦恩 , 大卫·阿莫斯 , Chia-Chun Hung先生 , 马修·博特维尼克 :
利用发展心理学的工具探索物理知识。 CoRR公司 abs/1804.01128 ( 2018 ) [i16] 吴彦(Yan Wu) , 格雷格·韦恩 , 亚历克斯·格拉夫斯 , 蒂莫西·利利克拉普 :
Kanerva机器:一种生成分布式内存。 CoRR公司 abs/1804.01756 ( 2018 ) 【i15】 Chia-Chun Hung先生 , 蒂莫西·利利克拉普 , 艾布拉森 , 吴彦(Yan Wu) , 梅赫迪·米尔扎 , 费德里科狂欢节 , 阿伦·阿胡贾 , 格雷格·韦恩 :
通过传输值优化长时间尺度上的代理行为。 CoRR公司 abs/1810.06721 ( 2018 ) [第14条] 吴彦(Yan Wu) , 格雷格·韦恩 , 卡罗尔·格雷戈 , 蒂莫西·利利克拉普 :
学习用于生成记忆的吸引子动力学。 CoRR公司 abs/1811.09556 ( 2018 ) [i13] 乔什·梅雷尔 , 阿伦·阿胡贾 , 武法姆 , Saran Tunyasuvunakool公司 , 刘思奇 , 德鲁瓦·蒂鲁马拉 , 尼古拉斯·希斯 , 格雷格·韦恩 :
类人机器人的视觉运动分级控制。 CoRR公司 abs/1811.09656 ( 2018 ) [i12] 大卫·罗尔尼克 , 阿伦·阿胡贾 , 乔纳森·施瓦兹 , 蒂莫西·利利克拉普 , 格雷格·韦恩 :
持续学习的经验回放。 CoRR公司 abs/1811.11682 ( 2018 ) [i11] 乔什·梅雷尔 , 伦纳德·哈森克韦尔 , 亚历山大·加拉肖夫 , 阿伦·阿胡贾 , Vu Pham公司 , 格雷格·韦恩 , 叶惠德 , 尼古拉斯·希斯 :
用于仿人控制的神经概率运动原语。 CoRR公司 abs/1811.11711 ( 2018 ) 2017 【c4】 王子玉 , 乔什·梅雷尔 , 斯科特·里德 , 南多·德·弗雷塔斯 , 格雷戈里·韦恩 , 尼古拉斯·希斯 :
对不同行为的稳健模仿。 NIPS公司 2017 : 5320-5329 [i10] 梅夫拉娜·杰米奇 , Chia-Chun Hung先生 , 亚当·桑托罗 , 格雷格·韦恩 , 夏基尔·穆罕默德 , 丹尼尔·希梅内斯·雷泽德 , 大卫·阿莫斯 , 蒂莫西·利利克拉普 :
具有记忆的生成时间模型。 CoRR公司 abs/1702.04649 ( 2017 ) [第九章] 乔什·梅雷尔 , 尤瓦尔·塔萨 , 德鲁瓦结核 , 斯里拉姆·斯里尼瓦桑 , 杰·莱蒙 , 王子玉 , 格雷格·韦恩 , 尼古拉斯·希斯 :
通过对抗性模仿从动作捕捉中学习人类行为。 CoRR公司 abs/1707.02201 ( 2017 ) [i8] 尼古拉斯·希斯 , 德鲁瓦结核 , 斯里尼瓦桑·斯里拉姆 , 杰·莱蒙 , 乔什·梅雷尔 , 格雷格·韦恩 , 尤瓦尔·塔萨 , 汤姆·埃雷斯 , 王子玉 , S.M.Ali Eslami先生 , 马丁·里德米勒 , 大卫·西尔弗 :
丰富环境中运动行为的出现。 CoRR公司 abs/1707.02286 ( 2017 ) [i7] 王子玉 , 乔什·梅雷尔 , 斯科特·里德 , 格雷格·韦恩 , 南多·德·弗雷塔斯 , 尼古拉斯·希斯 :
对不同行为的稳健模仿。 CoRR公司 abs/1707.02747 ( 2017 ) [i6] 马修·博特维尼克 , 大卫·G·T·巴雷特 , 彼得·巴塔利亚 , 南多·德·弗雷塔斯 , 达山库马兰 , 乔尔·雷波 , 蒂姆·利利克拉普 , 约瑟夫·莫达伊尔 , S.穆罕默德 , 尼尔·C·拉比诺维茨 , 丹尼尔·希梅内斯·雷泽德 , 亚当·桑托罗 , 汤姆·绍尔 , 克里斯托弗·萨默菲尔德 , 格雷格·韦恩 , 西奥芬妮·韦伯 , Daan Wierstra公司 , 谢恩·莱格 , 哈萨比斯 :
《构建自我学习和思考的机器:莱克等人评论》,《行为与大脑科学》,2017年。 CoRR公司 abs/1711.08378 ( 2017 ) 2016 [j3] 亚当·H·大理石 , 格雷格·韦恩 , 康拉德·P·科林 :
走向深度学习和神经科学的整合。 前沿计算。 神经科学。 10 : 94 ( 2016 ) [注2] 亚历克斯·格拉夫斯 , 格雷格·韦恩 , 马尔科姆·雷诺兹 , 蒂姆·哈雷 , 伊沃·达尼埃尔卡 , 阿格尼什卡·格拉布斯卡·巴文斯卡 , 塞尔吉奥·戈麦斯·科尔梅纳雷霍 , 爱德华·格雷芬斯特特 , 蒂亚戈·拉马略 , 约翰·阿加皮欧 , 阿德里亚·普伊格多梅内克·巴迪亚 , 卡尔·莫里茨·赫尔曼 , 尤里·兹沃斯 , 乔治·奥斯特罗夫斯基 , 亚当·凯恩 , 海伦·金 , 克里斯托弗·萨默菲尔德 , 菲尔·布隆森 , Koray Kavukcuoglu公司 , 哈萨比斯 :
使用具有动态外部存储器的神经网络进行混合计算。 国家。 538 ( 7626 ) : 471-476 ( 2016 ) 【c3】 伊沃·达尼埃尔卡 , 格雷格·韦恩 , 贝尼尼奥·乌里亚 , 纳尔·卡尔克布伦纳 , 亚历克斯·格拉夫斯 :
关联长短期记忆。 ICML公司 2016 : 1986-1994 【c2】 杰克·W·雷 , 乔纳森·亨特 , 伊沃·达尼埃尔卡 , 蒂莫西·哈雷 , 高级安德鲁·W , 格雷戈里·韦恩 , 亚历克斯·格拉夫斯 , 蒂姆·利利克拉普 :
使用稀疏读写扩展记忆增强神经网络。 NIPS公司 2016 : 3621-3629 [电子1] 塔里克·理查德·贝索尔德 , 安托万·博德斯 , 阿图尔·达维拉·加塞斯 , 格雷格·韦恩 :
2016年12月9日,西班牙巴塞罗那,与第30届神经信息处理系统年会(NIPS 2016)合办的《认知计算:集成神经和符号方法研讨会论文集》。 CEUR研讨会记录 1773, CEUR-WS.org公司 2016 [目录] [i5] 伊沃·达尼埃尔卡 , 格雷格·韦恩 , 贝尼尼奥·乌里亚 , 纳尔·卡尔克布伦纳 , 亚历克斯·格拉夫斯 :
关联长短期记忆。 CoRR公司 abs/1602.03032 ( 2016 ) [i4] 尼古拉斯·希斯 , 格雷戈里·韦恩 , 尤瓦尔·塔萨 , 蒂莫西·利利克拉普 , 马丁·里德米勒 , 大卫·西尔弗 :
调制运动控制器的学习和转换。 CoRR公司 腹肌/1610.05182 ( 2016 ) [i3] 杰克·W·雷 , 乔纳森·亨特 , 蒂姆·哈雷 , 伊沃·达尼埃尔卡 , 高级安德鲁·W , 格雷格·韦恩 , 亚历克斯·格拉夫斯 , 蒂莫西·利利克拉普 :
使用稀疏读写扩展记忆增强神经网络。 CoRR公司 abs/1610.09027 ( 2016 ) 2015 【c1】 尼古拉斯·希斯 , 格雷戈里·韦恩 , 大卫·西尔弗 , 蒂莫西·利利克拉普 , 汤姆·埃雷斯 , 尤瓦尔·塔萨 :
通过随机值梯度学习连续控制策略。 NIPS公司 2015 : 2944-2952 [i2] 尼古拉斯·希斯 , 格雷格·韦恩 , 大卫·西尔弗 , 蒂莫西·利利克拉普 , 尤瓦尔·塔萨 , 汤姆·埃雷斯 :
通过随机值梯度学习连续控制策略。 CoRR公司 abs/1510.09142 ( 2015 ) 2014 [j1] 格雷格·韦恩 , L.F.阿伯特 :
使用经过高级前向模型训练的网络进行分层控制。 神经计算。 26 ( 10 ) : 2163-2193 ( 2014 ) [i1] 亚历克斯·格拉夫斯 , 格雷格·韦恩 , 伊沃·达尼埃尔卡 :
神经图灵机器。 CoRR公司 abs/1410.5401 ( 2014 ) 2013 【b1】 格雷戈里·韦恩 :
自我建模神经系统。 美国哥伦比亚大学, 2013