提供商:Schloss Dagstuhl-莱布尼茨信息中心数据库:dblp计算机科学参考书目内容:文本/纯文本;charset=“utf-8”TY-非正式或其他出版物ID-DBLP:期刊/corr/MathewsonP16澳大利亚-马修森,科里·W·。澳大利亚-Pilarski,Patrick M。TI-机器人Agent训练中的同时控制和人的反馈,采用动作关键强化学习。JO-CoRR公司VL-abs/1606.069792016年上半年//UR-(欧元)http://arxiv.org/abs/1606.06979急诊室-