格雷戈里·法夸尔
人员信息
优化列表
2020年–今天
2023 [第19条] 马修·托马斯·杰克逊 , 江敏琦 , 杰克·帕克霍尔德 , 里斯托·武里奥 , 卢沛宁 , 格雷戈里·法夸尔 , 西蒙·怀特森 , 雅各布·N·福斯特 :
通过对抗环境设计发现一般强化学习算法。 NeurIPS公司 2023 [i19] 马修·托马斯·杰克逊 , 江敏琦 , 杰克·帕克霍尔德 , 里斯托·武里奥 , 卢沛宁 , 格雷戈里·法夸尔 , 西蒙·怀特森 , 雅各布·尼古拉·福斯特 :
通过对抗环境设计发现一般强化学习算法。 CoRR公司 abs/2310.02782 ( 2023 ) 2022 [第18条] 安吉洛斯·菲洛斯 , Eszter Vértes公司 , 齐塔·马里奥 , 格雷戈里·法夸尔 , 戴安娜·博萨 , 阿布拉姆·弗里森 , 费亚尔·M·P·贝巴哈尼 , 汤姆·绍尔 , 安德烈·巴雷托 , 西蒙·奥斯宾多 :
模型值不一致是认识不确定性的信号。 ICML公司 2022 : 6474-6498 [i18] 里斯托·武里奥 , 雅各布·贝克 , 西蒙·怀特森 , 雅各布·N·福斯特 , 格雷戈里·法夸尔 :
元梯度中偏差-方差权衡的研究。 CoRR公司 abs/2209.11303 ( 2022 ) 2021 [第17条] 马克西米利安·伊格尔 , 格雷戈里·法夸尔 , 杰琳娜·卢凯蒂娜 , 温德林·博默(Wendelin Boehmer) , 西蒙·怀特森 :
深度强化学习中的瞬时非静态和泛化。 ICLR公司 2021 [第16条] 安吉洛斯·菲洛斯 , 克莱尔·莱尔 , Yarin Gal公司 , 谢尔盖·莱文 , 娜塔莎·贾克斯 , 格雷戈里·法夸尔 :
PsiPhi-Learning:使用后继特征和逆时间差异学习进行演示的强化学习。 ICML公司 2021 : 3305-3317 [第15条] 格雷戈里·法夸尔 , 凯特·鲍姆利 , 齐塔·马里奥 , 安吉洛斯·菲洛斯 , 马特奥·赫塞尔 , 哈多·菲利普·范·哈塞尔特 , 大卫·西尔弗 :
自我一致的模型和价值观。 NeurIPS公司 2021 : 1111-1125 [第14条] 克里斯托弗·格林 , 安德烈·巴雷托 , 格雷戈里·法夸尔 , 大卫·西尔弗 , 萨汀德·辛格 :
适当的价值等价。 NeurIPS公司 2021 : 7773-7786 [i17] 安吉洛斯·菲洛斯 , 克莱尔·莱尔 , Yarin Gal公司 , 谢尔盖·莱文 , 娜塔莎·杰克斯 , 格雷戈里·法夸尔 :
PsiPhi-Learning:使用后继特征和逆时间差异学习进行演示的强化学习。 CoRR公司 abs/2102.12560 ( 2021 ) [i16] 克里斯托弗·格林 , 安德烈·巴雷托 , 格雷戈里·法夸尔 , 大卫·西尔弗 , 萨汀德·辛格 :
适当的价值等价。 CoRR公司 abs/2106.10316 ( 2021 ) 【i15】 格雷戈里·法夸尔 , 凯特·鲍姆利 , 齐塔·马里奥 , 安吉洛斯·菲洛斯 , 马特奥·赫塞尔 , 哈多·范·哈塞尔特 , 大卫·西尔弗 :
自我一致的模型和价值观。 CoRR公司 abs/2110.12840 ( 2021 ) [第14条] 安吉洛斯·菲洛斯 , Eszter Vértes公司 , 齐塔·马里奥 , 格雷戈里·法夸尔 , 戴安娜·博萨 , 阿布拉姆·弗里森 , Feryal M.P.Behbahani先生 , 汤姆·绍尔 , 安德烈·巴雷托 , 西蒙·奥斯宾多 :
模型值不一致是认识不确定性的信号。 CoRR公司 abs/2112.04153 ( 2021 ) 2020 [j1] 塔比什·拉希德 , 米卡耶尔·桑维利安 , 克里斯蒂安·施罗德·德维特 , 格雷戈里·法夸尔 , 雅各布·N·福斯特 , 西蒙·怀特森 :
深度多智能体强化学习的单调值函数分解。 J.马赫。 学习。 物件。 21 : 178:1-178:51 ( 2020 ) [第13条] 格雷戈里·法夸尔 , 劳拉·古斯塔夫森 , 林泽民 , 西蒙·怀特森 , 尼古拉·乌苏尼尔 , 加布里埃尔·辛纳维 :
不断增长的行动空间。 ICML公司 2020 : 3040-3051 [c12] 塔比什·拉希德 , 格雷戈里·法夸尔 , 贝鹏 , 西蒙·怀特森 :
加权QMIX:扩展单调值函数分解用于深度多智能体强化学习。 NeurIPS公司 2020 [i13] 塔比什·拉希德 , 米卡耶尔·桑维利安 , 克里斯蒂安·施罗德·德维特 , 格雷戈里·法夸尔 , 雅各布·N·福斯特 , 西蒙·怀特森 :
用于深度多智能体强化学习的单调值函数分解。 CoRR公司 abs/2003.08839 ( 2020 ) [i12] 马克西米利安·伊格尔 , 格雷戈里·法夸尔 , 杰琳娜·卢凯蒂娜 , 温德林·博默(Wendelin Boehmer) , 西蒙·怀特森 :
深度强化学习中非静态对泛化的影响。 CoRR公司 abs/2006.05826 ( 2020 ) [i11] 塔比什·拉希德 , 格雷戈里·法夸尔 , 贝鹏 , 西蒙·怀特森 :
加权QMIX:扩展单调值函数分解。 CoRR公司 abs/2006.10800 ( 2020 )
2010 – 2019
2019 [第11条] 米卡耶尔·桑维利安 , 塔比什·拉希德 , 克里斯蒂安·施罗德·德维特 , 格雷戈里·法夸尔 , 南塔斯·纳德利 , 蒂姆·G·J·鲁德纳 , 贾文雄 , 菲利普·H·S·托尔 , 雅各布·N·福斯特 , 西蒙·怀特森 :
星际争霸多智能体挑战。 美国原子能机构 2019 : 2186-2188 [第10条] 毛景凯 , 雅各布·N·福斯特 , 蒂姆·罗克塔舍尔 , Maruan Al-Shedivat公司 , 格雷戈里·法夸尔 , 西蒙·怀特森 :
随机计算图中任意阶梯度估计的基线。 ICML公司 2019 : 4343-4351 【c9】 杰琳娜·卢凯蒂娜 , 南塔斯·纳德利 , 格雷戈里·法夸尔 , 雅各布·N·福斯特 , 雅各布·安德烈亚斯 , 爱德华·格雷芬斯特特 , 西蒙·怀特森 , 蒂姆·罗克塔舍尔 :
基于自然语言的强化学习研究综述。 国际JCAI 2019 : 6309-6317 【c8】 格雷戈里·法夸尔 , 西蒙·怀特森 , 雅各布·N·福斯特 :
Loaded DiCE:为强化学习权衡任意阶得分函数梯度估计中的偏差和方差。 NeurIPS公司 2019 : 8149-8160 【c7】 克里斯蒂安·施罗德·德维特 , 雅各布·N·福斯特 , 格雷戈里·法夸尔 , 菲利普·H·S·托尔 , 温德林·博默(Wendelin Boehmer) , 西蒙·怀特森 :
多智能体公共知识强化学习。 NeurIPS公司 2019 : 9924-9935 [i10] 米卡耶尔·桑维利安 , 塔比什·拉希德 , 克里斯蒂安·施罗德·德维特 , 格雷戈里·法夸尔 , 南塔斯·纳德利 , 蒂姆·G·J·鲁德纳 , 贾文雄 , 菲利普·H·S·托尔 , 雅各布·N·福斯特 , 西蒙·怀特森 :
星际争霸多智能体挑战。 CoRR公司 abs/1902.04043 ( 2019 ) [第九章] 杰琳娜·卢凯蒂娜 , 南塔斯·纳德利 , 格雷戈里·法夸尔 , 雅各布·N·福斯特 , 雅各布·安德烈亚斯 , 爱德华·格雷芬斯特特 , 西蒙·怀特森 , 蒂姆·罗克塔舍尔 :
基于自然语言的强化学习研究综述。 CoRR公司 abs/1906.03926 ( 2019 ) [i8] 格雷戈里·法夸尔 , 劳拉·古斯塔夫森 , 林泽民 , 西蒙·怀特森 , 尼古拉·乌苏尼尔 , 加布里埃尔·辛纳维 :
不断增长的行动空间。 CoRR公司 abs/1906.12266 ( 2019 ) [i7] 格雷戈里·法夸尔 , 西蒙·怀特森 , 雅各布·N·福斯特 :
Loaded DiCE:为强化学习权衡任意顺序得分函数估计中的偏差和方差。 CoRR公司 abs/1909.10549 ( 2019 ) 2018 【c6】 雅各布·N·福斯特 , 格雷戈里·法夸尔 , Afouras三触角菌 , 南塔斯·纳德利 , 西蒙·怀特森 :
反事实多代理政策梯度。 AAAI公司 2018 : 2974-2982 【c5】 格雷戈里·法夸尔 , 蒂姆·罗克塔舍尔 , 马克西米利安·伊格尔 , 西蒙·怀特森 :
TreeQN和ATreeC:深度强化学习的不同树结构模型。 ICLR(海报) 2018 【c4】 雅各布·N·福斯特 , 格雷戈里·法夸尔 , 马鲁安·谢迪瓦特 , 蒂姆·罗克塔舍尔 , 埃里克·P·星 , 西蒙·怀特森 :
DiCE:无穷可微Monte-Carlo估计。 ICLR(车间) 2018 【c3】 雅各布·N·福斯特 , 格雷戈里·法夸尔 , 马鲁安·谢迪瓦特 , 蒂姆·罗克塔舍尔 , 埃里克·P·星 , 西蒙·怀特森 :
DiCE:无穷可微蒙特卡罗估计。 ICML公司 2018 : 1524-1533 【c2】 塔比什·拉希德 , 米卡耶尔·桑维利安 , 克里斯蒂安·施罗德·德维特 , 格雷戈里·法夸尔 , 雅各布·N·福斯特 , 西蒙·怀特森 :
QMIX:深度多智能体强化学习的单调值函数分解。 ICML公司 2018 : 4292-4301 [i6] 雅各布·N·福斯特 , 格雷戈里·法夸尔 , Maruan Al-Shedivat公司 , 蒂姆·罗克塔舍尔 , 埃里克·P·星 , 西蒙·怀特森 :
DiCE:无穷可微Monte-Carlo估计。 CoRR公司 abs/1802.05098 ( 2018 ) [i5] 塔比什·拉希德 , 米卡耶尔·桑维利安 , 克里斯蒂安·施罗德·德维特 , 格雷戈里·法夸尔 , 雅各布·N·福斯特 , 西蒙·怀特森 :
QMIX:深度多智能体强化学习的单调值函数分解。 CoRR公司 abs/1803.11485 ( 2018 ) [i4] 雅各布·N·福斯特 , 克里斯蒂安·施罗德·德维特 , 格雷戈里·法夸尔 , 菲利普·H·S·托尔 , 温德林·博默(Wendelin Boehmer) , 西蒙·怀特森 :
多智能体公共知识强化学习。 CoRR公司 abs/1810.11702 ( 2018 ) 2017 【c1】 雅各布·N·福斯特 , 南塔斯·纳德利 , 格雷戈里·法夸尔 , Triantafyllos Afouras公司 , 菲利普·H·S·托尔 , Pushmet Kohli公司 , 西蒙·怀特森 :
深度多智能体强化学习的稳定经验重播。 ICML公司 2017 : 1146-1155 [i3] 雅各布·N·福斯特 , 南塔斯·纳德利 , 格雷戈里·法夸尔 , 菲利普·H·S·托尔 , Pushmet Kohli公司 , 西蒙·怀特森 :
深度多智能体强化学习的稳定经验重播。 CoRR公司 abs/1702.08887 ( 2017 ) [i2] 雅各布·N·福斯特 , 格雷戈里·法夸尔 , Triantafyllos Afouras公司 , 南塔斯·纳德利 , 西蒙·怀特森 :
反事实多代理政策梯度。 CoRR公司 abs/1705.08926 ( 2017 ) [i1] 格雷戈里·法夸尔 , 蒂姆·罗克塔舍尔 , 马克西米利安·伊格尔 , 西蒙·怀特森 :
TreeQN和ATreeC:深度强化学习的差异化树规划。 CoRR公司 abs/1710.11417 ( 2017 )