“通过深度强化学习进行人性化控制。”
沃洛德米尔·姆尼赫 , Koray Kavukcuoglu公司 , 大卫·西尔弗 , 安德烈·鲁苏 , 乔尔·维内斯 , 马克·贝勒马尔 , 亚历克斯·格拉夫斯 , 马丁·里德米勒 , 安德烈亚斯·菲德杰兰 , 乔治·奥斯特罗夫斯基 , 斯蒂格·彼得森 , 查尔斯·比蒂 , 阿米尔·萨迪克 , Ioannis Antonoglou公司 , 海伦·金 , 达山库马兰 , Daan Wierstra公司 , 谢恩·莱格 , 哈萨比斯 :
通过深度强化学习进行人性化控制。 国家。 518 ( 7540 ) : 529-533 ( 2015 )
由于引用数据不可用,以下列表可能不完整, 引用字符串可能未成功映射到dblp中列出的项,并且 我们没有针对这些列表中给出的所有项目的完整和精心策划的元数据。