{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{-“日期-部件”:[[2024,4,5]],“日期-时间”:“2024-04-05T06:06:27Z”,“时间戳”:1712297187397},“引用-计数”:22,“出版商”:“IEEE”,“许可证”:[{“开始”:{:“日期-部分”:[2019,12,1]],”日期-时间“:“2019-12-01T00:00Z”,timestamp“:157515840000},”content-version“:”stm-asf“,“delay-in-days”:0,“URL”:“https:\/\/doi.org\/10.15223\/policy-029”},{“start”:{“date-parts”:[[2019,12,1]],“date-time”:“2019-12-01T00:00:00Z”,“timestamp”:157515840000},“content-version”:“stm-asf”,“dellay-in-days”:0“:{”domain“:[],”crossmark-restriction“:false},”short-container-title“:[],“published-print”:{“date-parts”:[[2019,12]]},“DOI”:“10.1109\/robio49542.2019.8961529”,“type”:“proceedings-article”,“created”:{“date-parts”:[2020,1,21]],“date-time”:“2020-01-21T19:49:51Z”,“timestamp”:1579636191000},”source“Crossref”,“is-referenced-by-count”:7,“title”:[“好奇驱动的非寡头探索cy强化学习方法“],“prefix”:“10.1109”,“author”:[{“given”:“Boyao”,“family”:“Li”,“sequence”:“first”,“affiliation”:[}“name”:“中国科学院自动化研究所,智能机器人系统研究中心”}]},{“given”:“Tao”,”family“:”Lu“,”sequence“:”additional“,”affiliance“:[{name”:“中国科学院自动化研究所,智能机器人系统研究中心”}]},{“given”:“Jiayi”,“family”:“Li”,“sequence”:“additional”,“affiliation”:[{“name”:“中科院自动化研究院,智能机器人系统研究中心”{]},“从属关系”:[{“name”:“中国科学院自动化研究所智能机器人系统研究中心”}]},{“given”:“英豪”,“family”:“蔡”,“sequence”:“additional”,“affiliation”:[[{”name“:”中国科学院自动研究所智能机械系统研究中心“}]}.,{”given“:”Shuo“,”family“:”Wang“,“sequence”:“additional”,“affiliation”:[{“name”:“中科院自动化研究所,智能机器人系统研究中心”}]}],“member”:“263”,“reference”:[}“key”:“ref10”,“doi-asserted-by”:“publisher”,“doi”:“10.1016\/0196-8858:“基于国家的探索与强化学习奖金研究”,“作者”:“徐”,“年份”:“2017年”,“新闻标题”:“IEEE云计算与大数据分析国际会议”},{“关键”:“参考12”,“首页”:“1471”,“文章标题”:《统一基于国家的探究与内在动机》,“作者“:“bellemare”,“年度”:“2016”,“journal-title”:“神经信息处理系统的进展”},{“key”:“ref13”,“first page”:《2753》,“article-title》:“#探索:基于计数的探索用于深度强化学习的研究”,“author”:“tang”,“year”:“2017”,“jornal-tittle”::“神经信号处理系统的发展”}:“古玩驱动学习的大规模研究”,“作者”:“burda”,“年份”:“2018”},{“key”:“ref15”,“article-title”:“随机网络蒸馏探索”,“author”:“burda”、“year”:“2018”},“作者”:“savinov”,“year”:“2018”},{“key”:“ref18”,“article-title”:“永远不要忘记:通过学习光流平衡探索和开发”,“author”:“yang”,“年份”:“2019”},“article-title”:“Qt-opt:基于视觉的机器人操作的可扩展深度强化学习”,“author”:“kalashnikov”,“year”:“2018”},{“key”:“ref3”,“doi-asserted-by”:“publisher”,“doi”:“10.1177\/0278364917710318”}:“规范化安德森加速非政策性深度强化学习”,“作者”:“shi”,“年份”:“2019”},{“关键”:“ref8”,“首页”:“5048”,“文章标题”:“后视经验回放”,“作家”:“andrychowicz”,“年”:“2017”,“期刊标题”:《神经信息处理系统的进展》}:“优先体验回放”,“作者”:“schaul”,“年份”:“2015”},{“key”:“ref2”,“doi-asserted-by”:“crossref”,“首页”:“529”,“doi”:“10.1038\/nature14236”,“article-title”:“通过深度强化学习进行人性化控制”,“volume”:《518》,“author”:“mnih”,“year”:“2015.”,“journal-title“:”Nature“}”,{”key“:“ref1”,“doi-asserted-b”y“:”publisher“,“DOI”:“10.1109”,“TNN.1998.712192”},{“key”:“ref9”,“article-title”:“深度强化学习的持续控制”,“author”:“lillicrap”,“year”:“2015”}833143“},{”key“:”ref21“,”DOI-asserted-by“:“publisher”,“DOI”:“10.1109\/IROS.2012.6386109”}],“event”:{“name”:“2019 IEEE机器人和仿生技术国际会议(ROBIO)”,“location”:“Dali,China”,“start”:}“date-parts”:[[2019,12,6]]},“end”:{“date-ports”:[2019,12,8]}},:[],“链接”:[{“URL”:“http://\/xplorestaging.ieee.org\/ielx7\/8953068\/89661374\/08961529.pdf?arnumber=8961529”,“内容类型”:“未指定”,“content-version”:“vor”,“intended-application”:“similarity-checking”},“存放”:{“date-parts”:[2023,1,20]],“日期时间”:“2023-01-20T19:15:09Z”,“时间戳”:16742109000},”score“:1,”resource“:{”primary”:{“URL”:“https:\/\/ieeexplore.iee.org\/document\/8961529\/”}},“副标题”:[],“短标题”:[],“已发布”:{“日期-部件”:[[2019,12]]},”引用计数“:22,”URL“:”http://\/dx.doi.org\/10.109\/robio49542.2019.8961529“,”关系“:{}”,“主题”:[[],”已发布“:{”日期-部件“:[2019,1]2]]}}}