{“状态”：“确定”，“消息类型”：“工作”，“信息版本”：“1.0.0”，“邮件”：{“索引”：{-“日期-部件”：[[2024,4,5]]，“日期-时间”：“2024-04-05T06:06:27Z”，“时间戳”：1712297187397}，“引用-计数”：22，“出版商”：“IEEE”，“许可证”：[{“开始”：{:“日期-部分”：[2019,12,1]]，”日期-时间“：“2019-12-01T00:00Z”，timestamp“：157515840000}，”content-version“：”stm-asf“，“delay-in-days”：0，“URL”：“https:\/\/doi.org\/10.15223\/policy-029”}，{“start”：{“date-parts”：[[2019,12,1]]，“date-time”：“2019-12-01T00:00:00Z”，“timestamp”：157515840000}，“content-version”：“stm-asf”，“dellay-in-days”：0“：{”domain“：[]，”crossmark-restriction“：false}，”short-container-title“：[]，“published-print”：{“date-parts”：[[2019,12]]}，“DOI”：“10.1109\/robio49542.2019.8961529”，“type”：“proceedings-article”，“created”：{“date-parts”：[2020,1,21]]，“date-time”：“2020-01-21T19:49:51Z”，“timestamp”：1579636191000}，”source“Crossref”，“is-referenced-by-count”：7，“title”：[“好奇驱动的非寡头探索cy强化学习方法“]，“prefix”：“10.1109”，“author”：[{“given”：“Boyao”，“family”：“Li”，“sequence”：“first”，“affiliation”：[}“name”：“中国科学院自动化研究所，智能机器人系统研究中心”}]}，{“given”:“Tao”，”family“：”Lu“，”sequence“：”additional“，”affiliance“：[{name”：“中国科学院自动化研究所，智能机器人系统研究中心”}]}，{“given”：“Jiayi”，“family”：“Li”，“sequence”：“additional”，“affiliation”：[{“name”：“中科院自动化研究院，智能机器人系统研究中心”{]}，“从属关系”：[{“name”：“中国科学院自动化研究所智能机器人系统研究中心”}]}，{“given”：“英豪”，“family”：“蔡”，“sequence”：“additional”，“affiliation”：[[{”name“：”中国科学院自动研究所智能机械系统研究中心“}]}.，{”given“：”Shuo“，”family“：”Wang“，“sequence”：“additional”，“affiliation”：[{“name”：“中科院自动化研究所，智能机器人系统研究中心”}]}]，“member”：“263”，“reference”：[}“key”：“ref10”，“doi-asserted-by”：“publisher”，“doi”：“10.1016\/0196-8858：“基于国家的探索与强化学习奖金研究”，“作者”：“徐”，“年份”：“2017年”，“新闻标题”：“IEEE云计算与大数据分析国际会议”}，{“关键”：“参考12”，“首页”：“1471”，“文章标题”：《统一基于国家的探究与内在动机》，“作者“：“bellemare”，“年度”：“2016”，“journal-title”：“神经信息处理系统的进展”}，{“key”：“ref13”，“first page”：《2753》，“article-title》：“#探索：基于计数的探索用于深度强化学习的研究”，“author”：“tang”，“year”：“2017”，“jornal-tittle”：：“神经信号处理系统的发展”}：“古玩驱动学习的大规模研究”，“作者”：“burda”，“年份”：“2018”}，{“key”：“ref15”，“article-title”：“随机网络蒸馏探索”，“author”：“burda”、“year”：“2018”}，“作者”：“savinov”，“year”：“2018”}，{“key”：“ref18”，“article-title”：“永远不要忘记：通过学习光流平衡探索和开发”，“author”：“yang”，“年份”：“2019”}，“article-title”：“Qt-opt：基于视觉的机器人操作的可扩展深度强化学习”，“author”：“kalashnikov”，“year”：“2018”}，{“key”：“ref3”，“doi-asserted-by”：“publisher”，“doi”：“10.1177\/0278364917710318”}：“规范化安德森加速非政策性深度强化学习”，“作者”：“shi”，“年份”：“2019”}，{“关键”：“ref8”，“首页”：“5048”，“文章标题”：“后视经验回放”，“作家”：“andrychowicz”，“年”：“2017”，“期刊标题”：《神经信息处理系统的进展》}：“优先体验回放”，“作者”：“schaul”，“年份”：“2015”}，{“key”：“ref2”，“doi-asserted-by”：“crossref”，“首页”：“529”，“doi”：“10.1038\/nature14236”，“article-title”：“通过深度强化学习进行人性化控制”，“volume”：《518》，“author”：“mnih”，“year”：“2015.”，“journal-title“：”Nature“}”，{”key“：“ref1”，“doi-asserted-b”y“：”publisher“，“DOI”：“10.1109”，“TNN.1998.712192”}，{“key”：“ref9”，“article-title”：“深度强化学习的持续控制”，“author”：“lillicrap”，“year”：“2015”}833143“}，{”key“：”ref21“，”DOI-asserted-by“：“publisher”，“DOI”：“10.1109\/IROS.2012.6386109”}]，“event”：{“name”：“2019 IEEE机器人和仿生技术国际会议（ROBIO）”，“location”：“Dali，China”，“start”：}“date-parts”：[[2019,12,6]]}，“end”：{“date-ports”：[2019,12,8]}}，：[]，“链接”：[{“URL”：“http://\/xplorestaging.ieee.org\/ielx7\/8953068\/89661374\/08961529.pdf？arnumber=8961529”，“内容类型”：“未指定”，“content-version”：“vor”，“intended-application”：“similarity-checking”}，“存放”：{“date-parts”：[2023,1,20]]，“日期时间”：“2023-01-20T19:15:09Z”，“时间戳”：16742109000}，”score“：1，”resource“：{”primary”：{“URL”：“https:\/\/ieeexplore.iee.org\/document\/8961529\/”}}，“副标题”：[]，“短标题”：[]，“已发布”：{“日期-部件”：[[2019,12]]}，”引用计数“：22，”URL“：”http://\/dx.doi.org\/10.109\/robio49542.2019.8961529“，”关系“：{}”，“主题”：[[]，”已发布“：{”日期-部件“：[2019,1]2]]}}}