马特杰·维克
人员信息
优化列表
2010 – 2019
2018 【c2】 托德·海丝特 , 马特杰·维克 , 奥利维尔·皮特金 , 马克·兰科特 , 汤姆·绍尔 , 比拉尔·皮奥 , 丹·霍根 , 约翰·泉 , 安德鲁·森多纳利斯 , 伊恩·奥斯班德 , 加布里埃尔·杜拉克-阿诺德 , 约翰·阿加皮欧 , 乔尔·雷波 , Audrunas Gruslys公司 :
从演示中进行深度Q学习。 AAAI公司 2018 : 3223-3230 [i5] 加尔·达拉 , 克里希纳穆西·德维约坦 , 马特杰·维克 , 托德·海丝特 , 科斯敏·帕杜拉鲁 , 尤瓦尔·塔萨 :
连续动作空间中的安全探索。 CoRR公司 abs/1801.08757 ( 2018 ) 2017 【c1】 安德烈·鲁苏 , 马特杰·维克 , 托马斯·罗斯 , 尼古拉斯·希斯 , 拉兹万·帕斯卡努 , Raia Hadsell公司 :
使用渐进式网络从像素学习Sim-to-Real Robot。 CoRL公司 2017 : 262-270 [i4] 伊瓦洛·波波夫 , 尼古拉斯·希斯 , 蒂莫西·利利克拉普 , 罗兰·哈夫纳 , 加布里埃尔·巴特·马龙 , 马特杰·维克 , 托马斯·兰普 , 尤瓦尔·塔萨 , 汤姆·埃雷斯 , 马丁·里德米勒 :
针对灵巧操作的数据高效深度强化学习。 CoRR公司 abs/1704.03073 ( 2017 ) [i3] 托德·海丝特 , 马特杰·维克 , 奥利维尔·皮特金 , 马克·兰科特 , 汤姆·绍尔 , 比拉尔·皮奥 , 安德鲁·森多纳利斯 , 加布里埃尔·杜拉克-阿诺德 , 伊恩·奥斯班德 , 约翰·阿加皮欧 , 乔尔·雷波 , Audrunas Gruslys公司 :
从演示中学习,实现真实世界的强化学习。 CoRR公司 abs/1704.03732 ( 2017 ) [i2] 马特杰·维克 , 托德·海丝特 , 乔纳森·舒尔茨 , 王富民(音) , 奥利维尔·皮特金 , 比拉尔·皮奥 , 尼古拉斯·希斯 , 托马斯·罗斯 , 托马斯·兰普 , 马丁·里德米勒 :
利用演示进行机器人问题的深度强化学习,奖励较少。 CoRR公司 abs/1707.08817 ( 2017 ) 2016 [i1] 安德烈·鲁苏 , 马特杰·维克 , 托马斯·罗斯 , 尼古拉斯·希斯 , 拉兹万·帕斯卡努 , Raia Hadsell公司 :
模拟到真实的机器人通过渐进网络从像素学习。 CoRR公司 abs/1610.04286 ( 2016 )