弗拉德·菲鲁
人员信息
优化列表
2020年–今天
2022 【c3】 埃塞尔·艾根 , 安基特·阿南德 , 劳伦特·奥尔索 , 泽维尔·格洛洛特 , 斯蒂芬·马库斯·麦卡勒 , 弗拉德·菲鲁 , Lei M.Zhang(张磊) , Doina Precup公司 , 希布尔·穆拉德 :
使用增量学习和后视经验回放证明定理。 ICML公司 2022 : 1198-1210 [i8] 阿米莉亚·格莱斯 , 纳特·麦克莱塞 , 马贾·特雷巴茨 , 约翰·阿斯兰尼德斯 , 弗拉德·菲鲁 , 蒂莫·埃瓦兹 , 玛丽贝斯·劳赫 , 劳拉·魏丁格 , 马丁·查德威克 , 菲比·萨克 , 露西·坎贝尔(Lucy Campbell-Gillingham) , 乔纳森·尤萨托 , 黄伯森 , 雷蒙娜·科马内斯库 , 范扬 , 阿比盖尔·西奥 , Sumanth Dathathri公司 , 罗里·格雷格 , 赵开方 , 道格·弗里茨 , 杰姆·桑切斯·埃利亚斯 , 理查德·格林 , Sona Mokrá , 尼古拉斯·费尔南多 , 吴伯西 , 雷切尔·福利 , 苏珊娜·杨 , 艾森·加布里埃尔 , 艾萨克 , 约翰·梅勒 , 哈萨比斯 , 科雷·卡武科格鲁 , 丽莎·安妮·亨德里克斯 , 杰弗里·欧文 :
通过有针对性的人类判断改善对话主体的一致性。 CoRR公司 abs/2209.14375 ( 2022 ) 2021 [i7] 弗拉德·菲鲁 , 埃塞尔·艾根 , 安基特·阿南德 , 扎法拉利·艾哈迈德 , 泽维尔·格洛洛特 , 劳伦特·奥尔索 , Lei M.Zhang(张磊) , Doina Precup公司 , 希布尔·穆拉德 :
从合成数据训练一阶定理证明者。 CoRR公司 abs/2103.03798 ( 2021 ) [i6] 埃塞尔·艾根 , 劳伦特·奥尔索 , 安基特·阿南德 , 泽维尔·格洛洛特 , 弗拉德·菲鲁 , Lei M.Zhang(张磊) , Doina Precup公司 , 希布尔·穆拉德 :
使用增量学习和后视经验回放证明定理。 CoRR公司 abs/2112.10664 ( 2021 ) 2020 【c2】 塞巴斯蒂安·拉卡尼埃 , 安德鲁·兰皮宁 , 亚当·桑托罗 , 大卫·P·赖歇特 , 弗拉德·菲鲁 , 蒂莫西·利利克拉普 :
通过设置-解决交互自动生成课程。 ICLR公司 2020 [i5] 埃塞尔·艾根 , 扎法拉利·艾哈迈德 , 安基特·阿南德 , 弗拉德·菲鲁 , 泽维尔·格洛洛特 , 劳伦特·奥尔索 , Doina Precup公司 , 希布尔·穆拉德 :
学习从合成定理证明。 CoRR公司 abs/2006.11259 ( 2020 )
2010 – 2019
2019 [i4] 塞巴斯蒂安·拉卡尼埃 , 安德鲁·兰皮宁 , 亚当·桑托罗 , 大卫·P·赖歇特 , 弗拉德·菲鲁 , 蒂莫西·利利克拉普 :
通过设置-解决互动实现课程自动化。 CoRR公司 abs/1909.12892 ( 2019 ) 2018 【c1】 拉斯·埃斯佩霍尔特 , 休伯特·索耶 , 雷米·穆诺斯 , 凯伦·西蒙扬 , 沃洛德米尔·姆尼赫 , 汤姆·沃德 , 约塔姆·多伦 , 弗拉德·菲鲁 , 蒂姆·哈雷 , 伊恩·邓宁 , 谢恩·莱格 , 科雷·卡武科格鲁 :
IMPALA:具有重要性加权参与者-学习者体系结构的可扩展分布式Deep-RL。 ICML公司 2018 : 1406-1415 [i3] 拉斯·埃斯佩霍尔特 , 休伯特·索耶 , 雷米·穆诺斯 , 凯伦·西蒙扬 , 沃洛德米尔·姆尼赫 , 汤姆·沃德 , 约塔姆·多伦 , 弗拉德·菲鲁 , 蒂姆·哈雷 , 伊恩·邓宁 , 谢恩·莱格 , 科雷·卡武科格鲁 :
IMPALA:具有重要性加权参与者-学习者体系结构的可扩展分布式Deep-RL。 CoRR公司 abs/1802.01561 ( 2018 ) [i2] 弗拉德·菲鲁 , 蒂娜·朱 , 乔什·特南鲍姆 :
以人类的速度:行动延迟的深度强化学习。 CoRR公司 abs/1810.07286 ( 2018 ) 2017 [i1] 弗拉德·菲鲁 , 威廉·惠特尼 , 约书亚·B·特南鲍姆 :
通过深度强化学习击败世界上最好的超级粉碎兄弟。 CoRR公司 abs/1702.06230 ( 2017 )