{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{“日期-部件”:[[2024,6,21]],“日期-时间”:“2024-06-21T02:52:29Z”,“时间戳”:1718938349402},“参考-计数”:33,“出版商”:“Springer Science and Business Media LLC”,“问题”:“7540”,“许可证”:[{“开始”:}“日期-零件”:[[2015,2,25]],”日期-时间我”:“2015-02-25T00:00:00Z”,“timestamp”:142482240000},“content-version”:“tdm”,“delay-in-days”:0,“URL”:“https:\/\/www.springer.com/tdm”},{“start”:{“date-parts”:[[2015,2,25]],“date-time”:“2015-02-25T00:00:00Z”,“timetamp”:1444822400000},tdm“}],“内容域”:{“域”:[“link.springer.com”],“crossmark-restriction”:false},“short-container-title”:[“Nature”],“published-print”:{“date-parts”:[[2015,2,26]]},”DOI“:”10.1038\/nature14236“,”type“:”journal-article“,”created“:{”date-part“:[[2015-2,24]],”date-time“:”2015-02-24T17:28:05Z“,”timestamp“:1424798885000}”,“page”:“529-533”,“update-policy”:“http://\/dx.doi.org\/10.1007\/springer_crossmark_policy”,“source”:“Crossref”、“is-referenced-by-count”:15779,“title”:[“通过深度强化学习进行人性化控制”],“prefix”:“10.1038”,“volume”:”518“,“author”:[{“give”:“Volodymyr”,“family”:“Mnih”,“sequence”:“first”,“affiliation”:[]},{“fixed”:“Koray”,“家族”:“Ka”vukcuoglu“,”序列“:“additional”,“affiliation”:[]},{“given”:“David”,“family”:“Silver”,“sequence”:“additive”,“从属关系”:[]},}“giving”:“Andrei A.”,“家族”:“Rusu”,”sequence“:”additional“,”affiliance“:[]{”sequent“:”Joel“,”family“:”Veness“,”segment“additionable”,“atriation”:[]}:“附加”,“从属关系”:[]},{“给定”:“Alex”,“family”:“Graves”,“sequence”:“additional”,“affiliation”:[]},{“给定”:“Martin”,“family”:“Riedmiller”,“sequence”:“additional”,“affiliation”:[]},{“给定”:“Andreas K.”,“family”:“Fidjeland”,“sequence”:“additional”,“affiliation”:[]},{“给定”:“Georg”,“family”:“Ostrovski”,“sequence”:“additional”,“affiliation”:[]},{“给定”:“Stig”,“家庭”:“Petersen”,“sequence”:“additional”,“affiliation”:[]},{“given”:“Charles”,“family”:“Beattie”,“sequence”:“additional”,“affiliation”:[]},{“given”:“Amir”,“family”:“Sadik”,“sequence”:“additional”,“affiliation”:[]},{“given”:“Helen”,“family”:“King”,“sequence”:“附加”,“affiliation”:[]},{“given”:“Dharshan”,“family”:“Kumaran”,“sequence”:“additional”,“affaliation”:[]}.,{”given“:”Daan“,”family“:”Wierstra“,”sequence“:”additional“,”affiliance“:[]{“给定”:“Shane”,“家族”:“Legg”,“序列”:“附加”,“从属关系”:[]},“givent”:“Demis”,“附加”,“隶属关系”:[]}],“成员”:“297”,“published-online”:{“date-parts”:[[2015,2,25]]},“reference”:[{“key”:“BFnature14236_CR1”,“volume-title”:“强化学习:简介”,“author”:“R Sutton”,“year”:“1998”,“unstructured”:“Sutton,R.&Barto,A.强化学习:介绍(麻省理工出版社,1998)”},{“key”::“10.5962\/bhl.title.55072”,“volume-title”:“动物智能:实验研究”,“author”:“EL Thorndike”,“year”:“1911”,“unstructured”:“Thorndicke,E.L.动物智能:试验研究(麦克米伦,1911)”},{“key”:“BFnature14236_CR3”,“doi-asserted-by”:“publisher”,“first-page”:“1593”,“author”:“W Schultz”,“year”:“1997”,“unstructured”:“Schultz,W.,Dayan,P.&Montague,P.R.预测和奖励的神经基质。Science 275,1593\u20131599(1997)”,“journal title”:“Science”},{“key”:“BFnature14236_CR4”,“first page”:《994》,“volume-title”:《Proc.IEEE.Compute.Soc.Conf.Compute.Vis.Pattern.Recognit.》,“author”:“T Serre”,“年份”:“2005年”,“非结构化”:“Serre,T.,Wolf,L.&Poggio,T.受视觉皮层启发的特征对象识别。Proc.IEEE.Comput.Soc.Conf.Compute.Vis.Pattern.Recognit.994\u20131000(2005)”},{“key”:“BFnature14236_CR5”,“doi-asserted-by”:“publisher”,“first page”:”193“doi”:“10.1007\/BF00344251”,“volume”:《36》,“author”:“K Fukushima”,“年份”:“1980年”,“非结构化”:“福岛,K.Neocognitron:不受位置变化影响的模式识别机制的自组织神经网络模型。Biol.Cybern.36,193\u2013202(1980)”,“新闻标题”:“Biol.Cybern.”},{“key”:“BFnature14236_CR6”,“doi-asserted-by”:“publisher”,“first-page”:“58”,“doi”:“10.1145\/20330.203343”,“volume”:“38”,“author”:“G Tesauro”,“year”:“1995”,“unstructured”:“Tesauro.G.时间差异学习与TD-Gammon.Commun.ACM 38,58\u201368(1995)”,“journal-title”:“Commun.AC M”},{“key”:”BFnature14236_CR7“,”doi-asserted-by“:”publisher“,”first page“55”,“doi”:“10.1007\/s10514-009-9120-4”,“volution”:“M Riedmiller”,“年份”:“2009”,“非结构化”:“Riedmiller,M.,Gabel,T.,Hafner,R.&Lange,S.机器人足球强化学习。Auton.Robots 27,55\u201373(2009)”,“日志标题”:“Auton.Robots”},{“key”:“BFnature14236_CR8”,“首页”:“240”,“volume-title”:“Proc.Int.Conf.Mach.Learn.”,“author”:“C Diuk”,“年份”:“2008”,“非结构性”:“Diuk,C.,Cohen,A.&Littman,M.L.高效强化学习的面向对象表示法。Proc.Int.Conf.Mach.Learn.240\u2013247(2008)”},{“key”:“BFnature14236_CR9”,“doi-asserted-by”:“publisher”,“first page”:”1“,“doi”:“10.1561\/220000006”,”volume“2”,“author”:“Y Bengio”,“year”:“2009”,“unstructured”:“Bengio,Y。学习人工智能的深层架构。机器学习的基础和趋势2,1\u2013127(2009)”,“期刊标题”:“机器学习的基本和趋势”},{“关键”:“BFnature14236_CR10”,“首页”:“1106”,“卷”:“25”,“作者”:“A Krizhevsky”,“年份”:“2012”,“非结构化”:“Krizhovsky,A.,Sutskever,I.&Hinton,G。使用深度卷积神经网络进行ImageNet分类。高级神经信息处理。系统。25,1106\u20131114(2012)“,“新闻标题”:“高级神经信息处理。系统。“},{”key“:”BFnature14236_CR11“,”doi-asserted-by“:”publisher“,”first-page“:”504“,”doi“:”10.1126\/science.1127647“,”volume“:“313”,”author“:”GE Hinton“,”year“:”2006“,”unstructured“:”Hinton,G.E.&Salakhutdinov,R.R.R。使用神经网络降低数据的维数。science 313,504\u2013507(2006)“,”journal-title“:”science“}”,{“key”:“”BFnature14236_CR12“,”doi-asserted-by“:”publisher“,”first page“:”253“,”doi“:”10.1613\/jair.3912“,“volume”:“47”,“author”:“MG Bellemare”,“year”:“2013”,“unstructured”:“Bellemare,M.G.,Naddaf,Y.,Veness,J.&Bowling,M.街机学习环境:通用代理评估平台。J.阿蒂夫。智力。Res.47253\u2013279(2013)”,“期刊标题”:“J.Artif。智力。Res.“},{”key“:”BFnature14236_CR13“,”doi-asserted-by“:”publisher“,”first page“:“391”,”doi“:”10.1007\/s11023-007-9079-x“,”volume”:“17”,“author”:“S Legg”,“year”:“2007”,“unstructured”:“Legg,S.&Hutter,M.Universal Intelligence:机器智能的定义。Minds Mach.17,391\u2013444(2007)“,”journal title“:”Minds Mach“。”},}“密钥”:“BFnature14236_CR14“,“首页”:“62”,“卷”:“26”,“作者”:“M Genesereth”,“年份”:“2005”,“非结构化”:“Genesereath,M.,Love,N.&Pell,B.一般游戏玩法:AAAI比赛概述。AI Mag.26,62\u201372(2005)“,”journal-title“:”AI Mag“},{”key“:”BFnature14236_CR15“,”first page“:“864”,“volume-title”:“Proc.Conf.AAAI.Artif.Intell.”,“author”:“MG Bellemare”,“year”:“2012”,“unstructured”:“Bellemar,M.G.,Veness,J.&Bowling,M.使用Atari 2600游戏调查应急意识。Proc.Conf。AAAI公司。Artif公司。智力。864\u2013871(2012)“},{“键”:“BFnature14236_CR16”,“卷标题”:“并行分布式处理:认知微观结构的探索”,“作者”:“JL McClelland”,“年份”:“1986”,“非结构化”:“McClelland,J.L.,Rumelhart,D.E.&Group,T.P.R。并行分布式处理:认知微观结构的探索(麻省理工学院出版社,1986)“},{”键“:”BFnature14236_CR17“,”doi-asserted-by“:”publisher“,”first page“:”2278“,”doi“:”10.1109\/5.726791“,”volume“:“86”,”author“:”Y LeCun“,”year“:”1998“,”unstructured“:”LeCun,Y.,Bottou,L.,Bengio,Y.&Haffner,P。基于梯度的学习应用于文档识别。程序。IEEE 86,2278\u20132324(1998)“,”期刊标题“:”。IEEE“},{”key“:”BFnature14236_CR18“,”doi-asserted-by“:”publisher“,”first page“:“559”,”doi“:”10.1113\/jphysiol.1963.sp007079“,”volume“:‘165’,”author“:”DH Hubel“,”year“:”1963“,”unstructured“:”Hubel,D.H.&Wiesel,T.N.cat\u2019s纹状体皮质中柱的形状和排列。J.Physiol.165,559\u2013568(1963)“,”journal-title“:“生理学杂志”},{“key”:“BFnature14236_CR19”,“首页”:“279”,《卷》:“8”,“作者”:“CJ Watkins”,“年份”:“1992”,“非结构化”:“Watkin,C.J.&Dayan,P.Q-learning.Mach.Learn.8,279\u2013292(1992)”,“期刊标题”:“Mach.Learn.”},{”key“:“BFnature14236-CR20”,“doi-asserted-by”:“publisher”,“第一页”:”674“doi”“:”10.1109\/9.580874“,”卷“:”42“,”作者“:“J Tsitsiklis”,“year”:“1997”,“unstructured”:“Tsitsicklis,J.&Roy,B.V.用函数近似分析时间差分学习。IEEE Trans.Automat.Contr.42,674\u2013690(1997)”,“journal-title”:“IEEE Trans.Automat.Contrr.”},{“key”:“BFnature14236_CR21”,“doi-asserted-by”:“publisher”,“first page”:”419“doi”:“10.1037\/0033-295X.102.3.419”,“卷”:“102”,“作者”:“JL McClelland”,“年份”:“1995”,“非结构化”:“McClellan,J.L.,McNaughton,B.L.&O\u2019Reilly,R.C。为什么海马体和新皮质中存在互补的学习系统:从联结主义学习和记忆模型的成功和失败中获得的见解。精神病。Rev.102,419\u2013457(1995)“,“新闻标题”:“心理。Rev.“},{”key“:”BFnature14236_CR22“,”doi-asserted-by“:”publisher“,”first page“:“220”,”doi“:”10.1016\/j.tins.2010.1006“,“volume”:“33”,“author”:“j O\u2019Neill”,“year”:“2010”,“unstructured”:“O \u2019 Neill,j.,Pleydell-Bouverie,B.,Dupret,D.&Csicsvari,j。再播放一遍:唤醒清醒的经验和记忆。《神经科学趋势》。33,220\u2013229(2010)“,“新闻标题”:“神经科学趋势”。“},{“key”:“BFnature14236_CR23”,“unstructured”:“Lin,L.-J.使用神经网络对机器人进行强化学习。技术报告,DTIC文档。(1993)”},“{”key:“BFnature14236-CR24”,“首页”:“317”,“卷”:“3720”,“作者”:“M Riedmiller”,“年份”:“2005”,“非结构化”:“Riedmille,M。神经拟合Q迭代-首次体验数据高效的神经强化学习方法。机器。学习。:ECML 3720,317\u2013328(Springer,2005)“,”期刊标题“:”马赫。学习。:ECML“},{“key”:“BFnature14236_CR25”,“首页”:“2579”,“volume”:“9”,“author”:“LJP Van der Maaten”,“year”:“2008”,“nonstructured”:“Van der Maaten,L.J.P.&Hinton,G.E.使用t-SNE.J.Mach.Learn.Res.92579\u20132605(2008)可视化高维数据”,“journal title”:“J.Mach.Learn.Res.”},{“key”:“BFnature14236_CR26”,“首页”:“1“,”volume-title“:”程序。国际Jt。Conf.神经。Netw公司。“,”author“:”S Lange“,”year“:”2010“,”unstructured“:”Lange,S.&Riedmiller,M.Deep自动编码器神经网络在强化学习中的应用。程序。国际Jt。Conf.神经。Netw公司。1\u20138(2010)“},{”key“:”BFnature14236_CR27“,”doi-asserted-by“:”publisher“,”first page“:“655”,“doi”:“10.1038\/nn.2304”,“volume”:“12”,“author”:“C-T Law”,“year”:“2009”,“unstructured”:“Law,C.-T.&Gold,J.I.强化学习可以解释视觉决策任务中的联想和感知学习。Nature Neurosci.12,655(2009)”,“期刊标题“:”自然神经科学。“},{”key“:”BFnature14236_CR28“,”doi-asserted-by“:”publisher“,”first-page“:”318“,”doi“:”10.1038\/415318a“,”volume“:“415”,”author“:”N Sigala“,”year“:”2002“,”unstructured“:”Sigala,N.&Logothetis,N.K.视觉分类形状在灵长类颞皮层具有选择性。Nature 415,318\u2013320(2002)“,”journal-title“:”Nature“}”,{“key”:“”BFnature14236_CR29“,”doi-asserted-by“:”publisher“,”first page“:”1439“,”doi“:”10.1038\/nn.3203“,”volume“:“15”,”author“:”D Bendor“,”year“:”2012“,”unstructured“:”Bendor,D.&Wilson,M.A.睡眠时偏重海马回放的内容。《自然神经科学》。151439\u20131444(2012)”,“期刊标题”:“自然神经科学。“},{”key“:”BFnature14236_CR30“,”首页“:”103“,”卷“:”13“,”作者“:”A Moore“,”年份“:”1993“,”非结构化“:”Moore,A.&Atkeson,C.优先扫描:用更少的数据和更少的实时性进行强化学习。Mach.Earn.13103\u2013130(1993)“,”期刊标题“:”Mach.Earn.“},{”key“:”BFnature14236_CR31“,”首页“:”2146“,”volume-title“:”程序。电气与电子工程师协会。Int.Conf.计算。视觉。“,”author“:”K Jarrett“,”year“:”2009“,”unstructured“:”Jarretd,K.,Kavukcuoglu,K.、Ranzato,M.A.和LeCun,Y.什么是对象识别的最佳多级架构?程序。电气与电子工程师协会。Int.Conf.计算。视觉。2146\u20132153(2009)“},{“key”:“BFnature14236_CR32”,“unstructured”:“Nair,V.&Hinton,G.E.校正线性单元改善了受限的Boltzmann机器。Proc.Int.Conf.Mach.Learn.807\u2013814(2010)”},},“key“:”BFnature1436_CR33“,”doi-asserted-by“:”publisher“,”first page“:“99”,“doi”:“10.1016\/S0004-3702(98)00023-X”,“volume”:”101“,“作者”:“LP Kaelbling”,“年份”:“1994年”,“非结构化”:“Kaelblin,L.P.,Littman,M.L.&Cassandra,A.R.在部分可观测随机域中的规划和行动。人工智能101,99\u2013134(1994)“,”日志标题“:”人工智能“}],”容器标题“:[”自然“],”原始标题“:[],”语言“:”en“,”链接“:[{”URL“:”http://www.Nature.com\/articles\/nature14236.pdf“,”内容类型“:”应用程序\/pdf“,”content-version“:”vor“,”intended-application“:”text-mining“},{”网址“:”http:\/\/www.nature.com/articles\/nature14236“,”content-type“:”text\/html“,”content-version“:”vor“,”intended-application“:”text-mining“},{“URL”:“http://www.nature.com\/articles\/hature14236.pdf”,“content-type:”application\/pdf“,”content-version”:“vor”,“intended-application”:“相似性检查”},“存放”:{“日期-部件”:[2023,5,18]],“date-time“:”2023-05-18T18:29:18Z“,”timestamp“:1684434558000},”score“:1,”resource“:{“primary”:{”URL“:”https:\/\/www.nature.com/articles\/nature14236“}},“subtitle”:[],“shorttitle”:[],“issued”:{“date-parts”:[2015年2月25日]]},‘references-count’:33,‘journal-issue’:{‘issue’:“7540”,“published-print”:{部分“:[2015,2,26]]}},”alternative-id“:[”BFnature14236“],“URL”:“http://\/dx.doi.org\/10.1038\/nature14236”,“关系”:{“has-review”:[{“id-type”:“doi”,“id”:“10.3410\/f.725368782.793506817”,“asserted-by”:“object”},{“id type”:“doi”,“id”:“103410\/f.7 2536878782.793 509339”,“asserted-by:”object“}]},“ISSN”:[“0028-0836”,“1476-4687”],“ISSN-type”:[{“value”:“0028-08”,“type”:“print”},{“value”:“1476-4687“,”type“:”electronic“}],”subject“:[],”published“:{”date-parts“:[[2015,2,25]]},”assertion“:[{”value“:“2014年7月10日”,”order“:1,”name“:”received“,”label“:”received“,“group”:{“name”:“Article History”,“label”:“文章历史”}},{“value”:“2015年1月16日”,“order”:2,“name”:“accepted”,“table”:“accepted“,”group“:{“name”:“ArticleHistory”,“label”:“文章历史“}},{“value”:“2015年2月25日”,“order”:3,“name”:“first_online”,“label”:“first online”,”group“:{”name“:”Article History“,”label“:”文章历史“{},”value“:”作者声明没有竞争性的经济利益。“,”order“:1,”name“:”Ethics“,“group”:{“name”“EthicsHeading”,“标签”:“竞争性利益”}}}]}}