玛扬克·达斯瓦尼
人员信息
SPARQL查询
优化列表
2020年–今天
2010 – 2019
2016 【c5】 汤姆·艾唯瑞特 , 丹尼尔·菲兰 , 玛扬克·达斯瓦尼 , 马库斯·赫特 :
理性主体中政策和效用函数的自我修正。 AGI公司 2016 : 1-11 [i2] 汤姆·艾唯瑞特 , 丹尼尔·菲兰 , 玛扬克·达斯瓦尼 , 马库斯·赫特 :
理性主体中政策和效用函数的自我修正。 CoRR公司 abs/1605.03142 ( 2016 ) 2015 【c4】 玛扬克·达斯瓦尼 , 简·雷克 :
强化学习者幸福感的定义。 AGI公司 2015 : 231-240 [i1] 玛扬克·达斯瓦尼 , 简·雷克 :
强化学习者幸福感的定义。 CoRR公司 abs/1505.04497 ( 2015 ) 2014 【c3】 玛扬克·达斯瓦尼 , 彼得·苏尼哈格 , 马库斯·赫特 :
用价值建议强化学习。 ACML公司 2014 2013 【c2】 玛扬克·达斯瓦尼 , 彼得·苏尼哈格 , 马库斯·赫特 :
基于历史的强化学习的Q学习。 ACML公司 2013 : 213-228 2012 【c1】 玛扬克·达斯瓦尼 , 彼得·苏尼哈格 , 马库斯·赫特 :
使用循环后缀树进行特征强化学习。 EWRL公司 2012 : 11-24