{“状态”：“确定”，“消息类型”：“工作”，“信息版本”：“1.0.0”，“邮件”：{“索引”：{“日期部分”：[[2024,9,7]]，“日期时间”：“2024-09-07T14:58:20Z”，“时间戳”：1725721100965}，“出版商位置”：“柏林，海德堡”，“参考计数”：115，“出版者”：“施普林格-柏林-海德堡（Springer Berlin Heidelberg）”，“isbn-type”：[{“类型”：”打印“，“值”：“9783646 2323744“}，{”类型“：“electronic”，“value”：“9783642323751”}]，“license”：[{“start”：{“date-parts”：[[2012,11,10]]，“date-time”：“2012-11-10T00:00:00Z”，“timestamp”：1352505600000}，“content-version”：“unspecified”，“delay-in-days”：0，“URL”：“http://www.springer.com\/tdm”}，{“start”：{“date-ports”：[2012,11,10]，“日期-时间”：“2012-11-10T00:00:00Z”，“时间戳”：1352505600000}，“content-version”：“tdm”，“delay-in-days”：0，“URL”：“http://www.springer.com/tdm”}，{“start”：{“date-parts”：[[2012,11,10]]，“date-time”：“2012-11-10T00:00:00Z”，“timestamp”：1352505600000}，“content-version”：“vor”，“delay-in-days”：“0，“URL”：“http://www.springer.com\/tdm”}]，“content-domain”“：{”domain“：[”link.springer.com“]，”crossmark-restriction“：false}，”，“short-container-title”：[]，“published-print”：{“date-parts”：[[2013]]}，“DOI”：“10.1007\/978-3642-32375-1_3”，“type”：“book-chapter”，“created”：{“date-parts”：[2013,3,29]]，“date-time”：“2013-03-29T03:35:02Z”，“timestamp”：1364528102000}，”page：“49-72”，“update-policy”：”http://\/dx.DOI.org\/10.1007\/springer_crossmark_policy“，”source“：”Crossref“，“is-referenced-by-count”：28，“title”：[“内在动机的功能和机制”]，“prefix”：“10.1007”，“author”：[{“给定”：“Marco”，“family”：“Mirolli”，“sequence”：“first”，“affiliation”：[]}，{“given”：“Gianluca”，“家族”：“Baldassarre”，“序列”：“additional”，“从属关系”：[]}]，“成员”：“297”，“在线发布”：{“日期段”：[[2012,11,10]]}，“reference”：[{“key”：“3_CR1”，“doi-asserted-by”：“crossref”，”first page“：“357”，“doi”：“10.1146”，annurev.ne.09.030186.002041”，“volume”：”9“，“author”：“G Alexander”，年：“1986”，“unstructured”：“亚历山大，G.，DeLong，M.，Strick，P.：连接基底神经节和皮层的功能分离回路的平行组织。Annul.Rev。神经科学。9，357\u2013381（1986）“，“新闻标题”：“年度。神经科学版。“}，{”key“：“3_CR2”，”doi-asserted-by“：”crossref“，”first page“：”5“，”doi“：”10.1016\/S1389-0417（01）00039-0“，“volume”：“3”，“author”：“G Baldassare”，“year”：“2002”，“unstructured”：“Baldasarre，G.：基底神经节在学习和选择运动行为中作用的模块化神经网络模型。J.Cogn.Syst.Res.3，5\u201313（2002a）”，“”《新闻标题》：J.Cogn。系统。研究“}，{“key”：“3_CR3”，“unstructured”：“Baldassarre，G.：用神经网络和强化学习进行规划。博士论文，埃塞克斯大学计算机科学系（2002b）”}，}，“issue”：“2”，“key“：“3-CR4”，“first page”：”2“，”volume“：”7“author”：“G Baldassarre”，“year”：“2010”，“非结构化”：“Baldassarre，G.，Mirolli，M.：理解技能的自主累积学习的主要开放挑战是什么？AMD Newslett。7（2），2\u20133（2010）“，“新闻标题”：“AMD Newslett。“}，{”key“：”3_CR5“，”doi-asserted-by“：”crossref“，”unstructured“：”Baldassarre，G.，Mirolli，M.：决定何时学习哪些技能：基于时间差异的能力的内在动机（td-cb-im）。In：Baldassar，GDOI“：”10.1007\/978-3642-32375-1“}，{“issue”：“3”，“key”：“3_CR6”，“DOI-asserted-by”：“crossref”，“first page”：”155“，“DOI”：“10.1109\/TAMD.2009.2037513”，《volume》：“1”，“author”：“A Baranes”，“year”：“2009”，“unstructured”：“Baranes，A.，Oudeyer，P.-Y.：R-iac：稳健的内在动机探索和主动学习。IEEE Trans.Auton.Mental Dev.1（3），155\u2013169（2009）“，”期刊标题“：”IEEE Trans。自动。心理发展。“}，{“key”：“3_CR7”，“doi-asserted-by”：“crossref”，“unstructured”：“Baranes，A.，Oudeyer，P.-Y.：机器人主动运动学习的内在动机目标探索：案例研究。摘自：智能机器人与系统国际会议论文集（IROS 2010）。台湾台北（2010）”，“doi”：“10.1109\/IROS.2010.5651385”}，{“key”：“3_CR8”，“first-page”：“215”，“volume-title”：“基底神经节的信息处理模型”，“author”：“A Barto”，“year”：“1995”，“unstructured”：“Barto，A.：适应性批评家和基底神经节。摘自：Houk，J.C.，Davis，J.，Beiser，D.（eds.）《基底神经节信息处理模型》，第215\u2013232页。麻省理工学院，剑桥（1995）“}，{“key”：“3_CR9”，“doi-asserted-by”：“crossref”，“unstructured”：“Barto，A.，Singh，S.，Chentanez，N.：层次技能集合的内在动机学习。In:国际发展学习会议（ICDL），La Jolla（2004）”，“doi”：“10.21236”\/ADA440280”}第一页“：”834“，”DOI“：”10.1109\/TSMC.1983.6313077“，”volume“：”13“，”author“：”A Barto“，”year“：”1983“，”unstructured“：”Barto，A.，Sutton，R.，Anderson，C.：可以解决难学控制问题的类神经元自适应元件。IEEE传输。系统。人类网络。13，834\u2013846（1983）“，“期刊标题”：“IEEE Trans。系统。人类网络。“｝，｛”issue“：”2“，”key“：”3_CR11“，”首页“：”3“，”卷“：”7“，”作者“：”AG Barto“，”年份“：”2010“，”非结构化“：”Barto，A.G.：什么是内在的奖励信号？AMD Newslett.7（2），3（2010）“，”期刊标题“：”AMD Newslett.“｝，｛”key“：”3_CR12“，”doi断言“：”crossref“，”非结构化“：”Barto，A.G.：内在动机和强化学习。收录：Baldassarre，G.，Mirolli，M.（编辑）《自然和人工系统中的内在激励学习》。Springer，Berlin（2012，本卷）“，”DOI“：”10.1007\/978-3642-32375-1_2“}，{”issue“：”4“，”key“：”3_CR13“，”DOI-asserted-by“：”crossref“，”first page“：“341”，“DOI”：“10.1023\/A:1025696116075”，“volume”：“13”，“author”：“AG Barto”，“year”：“2003”，“unstructured”：“Barto，A.G.，Mahadevan，S.：分层强化学习的最新进展。离散。事件动态。系统。13（4），341\u2013379（2003）“，“新闻标题”：“离散。事件动态。系统。“}，{”key“：”3_CR14“，”doi-asserted-by“：”crossref“，”unstructured“：”Berlyne，D.E.：冲突，煽动，好奇。McGraw-Hill，纽约（1960）“，”doi“：”10.1037\/11164-000“}”，{“key”：“3_CR15”，“doi-assert-by”：“Crosref”，“首页”：“395”，”doi:“10.1037\/0033-295X.111.2.395”“，”卷“：”111“”，“author”：“M Botvinick”，“year”：“2004”，“unstructured”：“Botvinick，M.，Plaut，D.：没有模式层次：对常规顺序动作及其病理学的循环连接主义方法。精神病。Rev.111，395\u2013429（2004）“，“新闻标题”：“心理。Rev.“}，{”key“：”3_CR16“，”doi-asserted-by“：”crossref“，”first page“：“139”，”doi“：”10.1016\/0004-3702（91）90053-M“，“volume”：“47”，”author“：”RA Brooks“，”year“：”1991“，”unstructured“：”Brooks，R.A.：“Intelligence without representation。Artif.Intell.J.47，139\u2013159“2”，“键”：“3_CR17”，“doi-asserted-by“：”crossref“，”first page“：”95“，”doi“：”10.1037\/h0061616“，”volume“：“46”，”author“：”RA Butler“，”year“：”1953“，”unstructured“：”Butler，R.A.：恒河猴对视觉探索动机的辨别学习。J.\u00a0公司。生理学。精神病。46（2），95\u201398（1953）“，“期刊标题”：“J.Comp。生理学。精神病。}，{“key”：“3_CR18”，“unstructured”：“Caligiore，D.，Mirolli，M.，Parisi，D.，Baldassarre，G.：一种用于模拟具有连续状态和动作的多种技能学习的生物启发分层强化学习架构。见：第十届表观遗传机器人国际会议论文集，第149卷。隆德大学认知研究，隆德（2010），}，{“卷标题”：“在那里：把大脑放在一起”，“年份”：“1997”，“作者”：“克拉克”，“关键”：“3_CR19”，“非结构化”：“克拉克，A.：在那里：把大脑、身体和世界再次放在一起。牛津大学出版社，牛津（1997）”}，{“卷标题”：“流动：最佳体验心理学”，“年份”：“1991”作者：“M Csikszentmihalyi”，“key”：“3_CR20”，“unstructured”：“Csikszentmihalyi，M.：流：最佳体验的心理学。Harper Perennial，New York（1991）“}，{”issue“：“7”，”key“：“3_CR21”，”doi-asserted-by“：”crossref“，”first page“：”771“，”doi“：”10.1016\/j.neubiev.2004.09.006“，”volume“：：”28“，”author“：”JW Dalley“，”year“：”2004“，”unstructured“：”Dalley，J.W.、Cardinal，R.N.、Robbins，T.W.：啮齿动物的前额叶执行和认知功能：神经和神经化学底物。神经科学。生物行为学。Rev.28（7），771\u2013784（2004）“，“期刊标题”：“神经科学”。生物行为学。Rev.“}，{”key“：”3_CR22“，”unstructured“：”Dayan，P.，Hinton，G.E.：封建强化学习。In:Advances In Neural Information Processing Systems 5，pp.271\u2013278。Morgan Kaufmann，San Francisco（1993）“}，{“卷时间”：“个人因果关系：行为的内部情感决定因素”，“年份”：“1968年”，“作者”：“R De Charms”，“key”：“3_CR23”，“非结构化”：“De Charm，R.：个人因果关系，行为的内部感情决定因素。学术，纽约（1968）”}crossref“，”DOI“：”10.1007\/978-1-4613-4446-9“，”volume-title“：”内在动机“，”author“：”E Deci“，“year”：“1975”，“unstructured”：“Deci，E.：内在动机。Plenum，New York（1975）“}，{“key”：“3_CR25”，“doi asserted by”：“crossref”，“doi”：“10.1007\/978-1-4899-2271-7”，“卷标题”：“人类行为中的内在动机和自决”，“作者”：“EL Deci”，“年份”：“1985”，“非结构化”：“Deci，E.L.，Ryan，R.M.：人类行为中的内在动机和自决。Plenum，New York（1985）”}，{key“：”3_CR26“，”doi-asserted-by“：”crossref“，”first-page“：”91“，”doi“：”10.1037\/h0046861“，”volume“：“64”，”author“：”W Dember“，”year“：”1957“，”unstructured“：”Dember，W.，Earl，R.：探索性、操纵性和好奇心行为分析。精神病。Rev.64，91\u201396（1957）“，“新闻标题”：“心理。Rev.“}，{”key“：”3_CR27“，”doi-asserted-by“：”crossref“，”first page“：“227”，“doi”：“10.1613\/jair.639”，“volume”：“13”，“author”：“T Dieterich”，“year”：“2000”，“unstructured”：“Dietrich，T.：通过最大值函数分解进行分层强化学习。J.Artif.Intell.Res.13，227\u2013303（2000）”，“journal-title”：“J.Articf.Intell”决议“}，{“issue”：“5714”，“key”：“3_CR28”，“doi-asserted-by”：“crossref”，“first page”：”1476“，“doi”：“10.1126\/science.1107026”，“卷”：“307”，“作者”：“E Domett”，“年份”：“2005”，“非结构化”：“Dommett，E.、Coizet，V.、Blaha，C.D.、Martindale，J.、Lefebvre，V.，Walton，N.、Mayhew，J.E.W.、Overton，P.G.、Redgrave，P.：视觉刺激如何在短时间内激活多巴胺能神经元。《科学》307（5714），1476\u20131479（2005）”，“杂志标题”：“科学”}，{“问题”：“6”，“关键”：“3_CR29”，“doi-asserted-by”：“crossref”，“首页”：“732”，“doi“”：“10.1016\/S0959-4388（00）00153-7”，“volume”：“10”，“author”：“K Domia”，“year”：“2000”，“unstructured”：“Doya，K.：基底神经节和小脑在学习和运动控制中的补充作用。Curr.Opin.Neurobiol.10（6），732\u2013739（2000）”，“journal-title”：“Curr.Opin.Neuralbiol.”}，{“issue”：“6”，“key”：”“3_CR30”，“doi-asserted-by”：“交叉参考”，“首页”：“1347”，“DOI”：“10.1162\/089976602753712972”，“卷”：“14”，“作者”：“K.Doya”，“年份”：“2002”，“非结构化”：“Doya，K.，Samejima，K.、Katagiri，K.-i.，Kawato，M.：基于多模型的强化学习。神经计算。14（6），1347\u20131369（2002）”，“日志标题”：“神经计算”}，{“键”：“3_CR31”，“DOI-asserted-by“：”crossref“，”DOI“：“10.1515\/9781503620766”，“volume-title”：“认知失调理论”，“author”：“L Festinger”，“year”：“1957”，“unstructured”：“Festinge，L.：认知失调理论。斯坦福大学出版社，斯坦福（1957）”}，{“key”：“3_CR32”，“非结构化”：“Fiore，V.，Mannella，F.，Mirolli，M.，Gurney，K.，Baldassarre，G.：由中性刺激驱动的仪器条件作用：用模拟大鼠测试的模型。摘自：第八届表观遗传机器人国际会议论文集，第139期，第13\u201320页。Lund University Cognitive Studies，Lund（2008）“}，{”key“：”3_CR33“，”doi-asserted-by“：”crossref“，”first page“：“319”，“doi”：“10.1016\/S0896-6273（01）00285-9”，“volume”：“2”，“author”：“J Fuster”，“year”：“2001”，“unstructured”：“Fuster，J.：前额叶皮层更新：时间是本质。Neuron 2，319\u2013333（2001）”，“新闻标题”：“神经元”}，{“issue“：”21“，”key“：”3_CR34“，”doi-asserted-by“：”crossref“，”first-page“：”5730“，”doi“：”10.1523\/JNEUROSCI.0012-07.2007“，”volume“：“27”，”author“：”S Geisler“，”year“：”2007“，”unstructured“：”Geisler，S.，Derst，C.，Veh，R.W.，Zahm，D.S.：大鼠腹侧被盖区的谷氨酸能传入。《神经科学杂志》。27（21），5730\u20135743（2007）“，“期刊标题”：《神经科学杂志》。“}，{”issue“：”4“，”key“：”3_CR35“，”doi-asserted-by“：”crossref“，”first-page“：”590“，”doi“：”10.1016\/j.humov.2007.05.009“，”volume“：“26”，”author“：”ST Grafton“，”year“：”2007“，”unstructured“：”Grafton，S.T.，Hamilton，A.：大脑中动作表征的分布式层次的证据。Hum.brain Mapp.Movement Sci.26（4），590\u2013616（2007）“，”journal-title“：”嗯，大脑地图。运动科学。“｝，｛”key“：”3_CR36“，”doi asserted by“：”crossref“，”首页“：”105“，”doi“：”10.1146\/annuvrev.neuro.29.051605.112924“，”卷“：”29“，”作者“：”M Graziano“，”年份“：”2006“，”非结构化“：”Graziano，M.：运动皮层行为谱系的组织。Annu.Rev.Neurosci.29，\u00a0105\u2013134（2006）“，”期刊标题“Annu.Rev.Neurosci.”｝，｛”key“：”3_CR37“，”doi-asserted-by“：”crossref“，”unstructured“：”Gurney，K.，Lepora，N.，Shah，A.，Koene，A.，Redgrave，P.：动作发现和内在动机：一种生物约束的形式化。收录：Baldassarre，G.，Mirolli，M.（编辑）《自然和人工系统中的内在激励学习》。Springer，Berlin（2012，本卷）“，”DOI“：”10.1007\/978-3642-32375-1_7“}，{”issue“：”6“，”key“：”3_CR38“，”DOI-asserted-by“：”crossref“，”first page“：“401”，“DOI”：“10.1007\/PL00007984”，“volume”：“84”，“author”：“K Gurney”，“year”：“2001”，“unstructured”：“Gurney，K.，Prescott，T.J.，Redgrave，P.：基底神经节动作选择的计算模型I.一种新的功能解剖学。生物、网络。84（6），401\u2013410（2001）“，“杂志标题”：“新的功能解剖学。生物、网络。“}，{”key“：”3_CR39“，”doi-asserted-by“：”crossref“，”first-page“：”289“，”doi“：”10.1037\/h0058114“，”volume“：“43”，”author“：”HF Harlow“，”year“：”1950“，“unstructured”：“Harlow，H.F.：猴子在内在动机复杂谜题中的反应学习和满足感。J.Comp.Physiol.Psychol.43，289\u2013294（1950）“，”journal-title“：”J。压缩机。生理学。精神病。“}，{”key“：”3_CR40“，”doi-asserted-by“：”crossref“，”first-page“：”228“，”doi“：”10.1037\/h0056906“，”volume“：“40”，”author“：”HF Harlow“，”year“：”1950“，“unstructured”：“Harlow，H.F.，Harlow M.K.，Meyer，D.R.：由操纵驱动的学习。J.Exp.Psychol.40，228\u2013234（1950）“，”journal-title“：”J.Exp.Psychol“。”}，{“键”：“3_CR41”，“doi-asserted-by“：”crossref“，”first-page“：”2201“，”doi“：”10.1162\/089976601750541778“，”volume“：”13“，”author“：”M Haruno“，”year“：”2001“，”unstructured“：”Haruno，M.，Wolpert，D.，Kawato，M.：用于感觉运动学习和控制的马赛克模型。神经计算。13，2201\u20132220（2001）“，“新闻标题”：“神经计算。“}，{”key“：”3_CR42“，”doi-asserted-by“：”crossref“，”first-page“：”243“，”doi“：”10.1037\/h0041823“，“volume”：“62”，“author”：“D Hebb”，“year”：“1955”，“unstructured”：“Hebb，D.：驱动器和概念神经系统。Psychol.Rev.62，243\u2013254（1955）”，“journal-title”：“Psychol/Rev.}”，{“issue”：“6”，“key”：”3_CR43“，”doi-asserted-by“：”crossref“，”first page“：”555“，“DOI”：“10.1016\/j.neubiorev.2003.09.003”，“volume”：“27”，“author”：“CA Heidbreder”，“year”：“2003”，“unstructured”：“Heidbred，C.A.，Groenewegen，H.j.：大鼠的内侧前额叶皮层：基于功能和解剖特征的背腹侧区别的证据。神经科学。生物行为学。Rev.27（6），555\u2013579（2003）“，“期刊标题”：“神经科学”。生物行为学。Rev.“}，{“volume-title”：“基于模型的控制：桥接严格理论和先进技术”，“year”：“2009”，“key”：“3_CR44”，“unstructured”：“Hof，P.M.，Scherer，C.，Heuberger，P.S.（eds.）：基于模型的控件：桥接严密理论和先进科技。Springer，Berlin（2009）”}首页”：“651”，“DOI”：“10.1016/S0306-4522（00）00019-1”，“卷”：“96”，“作者”：“J Horvitz”，“年份”：“2009”，“非结构化”：“Horvitz，J.：中边缘皮质和黑质纹状体多巴胺对显著非奖赏事件的反应。《神经科学》96（4），651\u2013656（2009）“，“期刊标题”：“神经科学”}，{“key”：“3_CR46”，“首页”：“249”，“volume-title”：“基底神经节信息处理模型”，“author”：“J Houk”，“year”：“1995”，“unstructured”：“Houk，J.、Adams，J.和Barto，A.：基底神经节如何生成和使用预测强化的神经信号的模型。摘自：Houk，J.、Davis，J、Beiser，D.（编辑）《基底神经节的信息处理模型》，第249\u2013270页。麻省理工学院，剑桥（1995）“}，{“key”：“3_CR47”，“unstructured”：“Huang，X.，Weng，J.：开发机器人价值体系中的新颖性和强化学习。摘自：第二届表观遗传机器人国际研讨会论文集，爱丁堡，pp.\u00a047\u201355（2002）”}，}“volume-title”：“行为原则”，“年份”：“1943”，“作者”：“CL-Hull”，“key“3_CR48“，“非结构化”：“赫尔，C.L.：行为原则。阿普尔顿·世纪克罗夫茨，纽约（1943）“}，{“关键”：“3_CR49”，“首页”：“189”，“卷”：“13”，“作者”：“H·亨特”，“年份”：“1965”，“非结构化”：“亨特，H.：内在动机及其在心理发展中的作用。内布拉斯加州交响乐。动机13，189\u2013282“，”doi-asserted-by“：”crossref“，”first page“：”535“，”DOI“：”10.1016\/S0893-6080（02）00047-3“，”volume“：“15”，”author“：”D Joel“，”year“：”2002“，”unstructured“：”Joel，D.，Niv，Y.，Ruppin，E.：基底神经节的Actor-critic模型：新的解剖和计算视角。神经网络。15（4），535\u2013547（2002）”，“期刊标题”：“神经网络。“}，{”issue“：”2“，”key“：”3_CR51“，”doi-asserted-by“：”crossref“，”first page“：“363”，”doi“：”10.1016\/0306-4522（94）90536-3“，”volume“：，363\u2013379（1994）“，”journal-title“：”Neuroscience“}，{“key”：“3_CR52”，”first page“：”2259“，”volume“：“7”，“author”：“A Jonsson”，“year”：“2006”，“unstructured”：“Jonsson，A.，Barto R53英寸doi-asserted-by“：”crossref“，”first page“：”307“，”doi“：”10.1207\/s15516709cog1603_1“，“volume”：“16”，“author”：“MI Jordan”，“year”：“1992”，“unstructured”：“Jordan，M.I.，Rumelhart，D.E.：正向模型：与远程教师一起监督学习。认知。科学。16，307\u2013354（1992）“，“新闻标题”：“认知。科学。“}，{”key“：”3_CR54“，”doi-asserted-by“：”crossref“，”first-page“：”51“，”doi“：”10.1037\/h0032356“，”volume“：“22”，“author”：“J Kagan”，“year”：“1972”，“unstructured”：“Kagan，J.：动机与发展。J.Pers.Soc.Psychol.22，51\u201366（1972）”，“journal-title”：“J.Pers.Soc.Phsychol.”}，}“issue”：“4”，“key”：“3_CR55”，“doi-asserted-by”：“crossref”，“first page”：261“，“DOI”：“10.1037\/h0040782”，“volume”：“48”，“author”：“G Kish”，“year”：“1955”，“unstructured”：“Kish，G.：当光照开始作为强化刺激时的学习。J.公司。生理学。精神病。48（4），261\u2013264（1955）“，“期刊标题”：“J.Comp。生理学。精神病。“}，{”issue“：“1”，”key“：“3_CR56”，”doi-asserted-by“：”crossref“，”first page“：”121“，“doi”：“10.1080\/00221325.1956.10532960”，“volume”：“88”，“author”：“G Kish”，“year”：“1956”，“unstructured”：“Kish，G.，Antonitis，J.：两种纯合子小鼠的无条件操作行为。J.\u00a0Genet.Psychol.Aging 88（1），121\u2013129（1956）“，”杂志标题“：”J。遗传学。精神病。老化”}，{“关键”：“3_CR57”，“非结构化”：“Konidaris，G.D.，Barto，A.G.：使用技能链在持续强化学习领域中发现技能。摘自：《神经信息处理系统进展》（NIPS 2009），第1015\u20131023页。加拿大不列颠哥伦比亚省温哥华（2009）“}，{”卷-时间“：“人工生命：生命系统合成与模拟跨学科研讨会论文集”，“年份”：“1989年”，“关键”：“3_CR58”，“非结构化”：“Langton，C.G.（编辑）《人工生命：生命系统合成与模拟跨学科研讨会论文集》。Addison-Wesley，Redwood City（1989）“}，{“key”：“3_CR59”，“unstructured”：“Lee，R.，Walker，R.、Meeden，L.、Marshall，J.：基于类别的内在动机。摘自：第九届表观遗传机器人国际会议论文集，第146卷，第81\u201388页。隆德大学认知研究，隆德（2009）“}，{“问题”：“5”，“关键”：“3_CR60”，“doi-asserted-by”：“crossref”，“首页”：“703”，“doi”：“10.1016\/j.neuron.2005.05.002”，“卷”：“46”，“作者”：“JE Lisman”，“年份”：“2005”，“非结构化”：“Lisman，J.E.，Grace，A.A.：海马-vta回路：控制信息进入长期记忆。Neuron 46（5），703\u2013713（2005）“，“新闻标题”：“Neuron”}，{“key”：“3_CR61”，“unstructured”：“Marshall，J.，Blank，D.，Meeden，L.：发展机器人学中自我激励的应急框架。摘自：第三届国际发展与学习会议论文集（ICDL 2004），La Jolla，pp.104\u2013111（2004）”}、{“issue”：“1”，“key“：”3_CR62”，“doi asserted by”：“crossref”，“first page”：“7”，“doi”：“10.1177\/1057123081002336”，“volume”：“17”，“author”：“K Merrick”，“year”：“2009”，“nonstructured”：“Merrick，K.，Maher，M.L.：从有趣的事件中进行有动机的学习：适用于复杂环境的自适应多任务学习代理。阿达普。行为。17（1），7\u201327（2009）“，“新闻标题”：“Adap。行为。“}，{”key“：”3_CR64“，”doi-asserted-by“：”crossref“，”unstructured“：”Meunier，D.，Lambiotte，R.，Bullmore，E.T.：脑网络的模块化和层次化模块化组织。Front.Neurosci.4（2010）“，”doi“：”10.3389\/fnis.2010.00200“}”，{“volume-title”：“从动物到动画：第一届自适应行为模拟国际会议论文集”，“年份”：“1990年”，“关键”：“3_CR65”，“非结构化”：“Meyer，J.-A，Wilson，S.W.（编辑）：从动物到动画师：第一届适应行为模拟国际大会论文集。麻省理工学院，剑桥（1990）“}，{”key“：”3_CR66“，”doi-asserted-by“：”crossref“，”first page“：“167”，“doi”：“10.1146”annurev.neuro.24.167“，”volume“：‘24’，”author“：”E Miller“，”year“：”2001“，”unstructured“：”Miller，E.，Cohen，J.：前额叶皮层功能的整合理论。《神经科学年鉴》24，167\u2013202（2001）“，”journal title“：”annurev.Rev。神经科学。“}，{”issue“：”4“，”key“：”3_CR67“，”doi-asserted-by“：”crossref“，”first-page“：”381“，”doi“：”10.1016\/S0301-0082（96）00042-1“，”volume“：“50”，”author“：”J Mink“，”year“：”1996“，”unstructured“：”Mink，J.：基底神经节：竞争性运动程序的集中选择和抑制。Prog.Neurobiol.50（4），381\u2013425（1996）“，”journal-标题“：”掠夺。神经生物学。“}，{”key“：”3_CR68“，”doi-asserted-by“：”crossref“，”unstructured“：”Mirolli，M.，Santucci，V.G.，Baldassarre，G.：相多巴胺作为驱动动作获得和奖赏最大化的内在和外在强化的预测误差：一项模拟机器人研究。神经网络（2012年，提交出版）“，”doi“：”10.1016\/j.neunet.2012.12.012“}，{“volume-title”：“Mach”，“year”：“1997”，“author”：“TM Mitchell”，“key”：“3_CR69”，“unstructured”：“米切尔，T.M.：Mach.Learn..McGraw-Hill，New York（1997）”}，}“key“：”3_CR70“，“doi-asserted-by”：“crossref”，《首页》：“60”，“doi”：“10.1037\/h0054833”，“volume”：”47“，”author“：”K Montgomery“，”year“：”1954“，”unstructured“：”蒙哥马利：探索性动力在学习中的作用。J.公司。生理学。精神病。47，60\u201364（1954）“，“新闻标题”：“J.Comp。生理学。精神病。}，{“key”：“3_CR71”，“doi-asserted-by”：“crossref”，“unstructured”：“Otmakova，N.，Duzel，E.，Deutch，A.Y.，Lisman，J.E.：hippocampal-vta循环：新颖性和动机在控制信息进入长期记忆中的作用。in：Baldasserre，G.，Mirolli，M.（编辑）自然和人工系统中的内在激励学习。Springer，Berlin（2012，本卷）“，“DOI”：“10.1007\/978-3642-32375-1_10”}，{“volume-title”：“什么是内在动机？”，“year”：“2007”，“author”：“P.-Y.Oudeyer”，“key”：“3_CR72”，“unstructured”：“Oudeyer，P.-Y，Kaplan，F.：什么是内在动力？计算方法的类型学。Front.Neurobot。（2007）doi-asserted-by“：”crossref“，”first page“：”265“，”doi“：”10.1109\/TEVC.2006.890271“，”volume“：“11”，”author“：”P.-Y.Oudeyer“，“year”：“2007”，”unstructured“：”Oudeyer，P.-Y.，Kaplan，F.，Hafner，V.V.V.V.：自主精神发展的内在动机系统。IEEE传输。进化。计算。11（2），265\u2013286（2007）”，“期刊标题”：“IEEE Trans。进化。计算。“}，{”key“：”3_CR74“，”unstructured“：”Parr，R.，Russell，S.J.：用机器层次结构强化学习。In：《神经信息处理系统的进展》，麻省理工学院，剑桥（1997）“}”，{“volume-title”：“理解智能”，“年份”：“1999”，“author”：“R Pfeifer”，“key”：“3_CR75”，“unstructure”：“”Pfeifer，R.，Scheier，C.：理解智力。MIT，Cambridge（1999）“}，{”issue“：”2“，”key“：”3_CR76“，”doi-asserted-by“：”crossref“，”first page“：“159”，“doi”：“10.1080\/09540090600768609”，“volume”：“18”，“author”：“J Provost”，“year”：“2006”，“unstructured”：“Provost，J.、Kuipers，B.J.、Miikkulainen，R.：通过自组织独特的状态抽象发展导航行为。连接。科学。18（2），159\u2013172（2006）“，“日志标题”：“连接。科学。“}，{”问题“：”6“，”关键“：”3_CR77“，”首页“：”1825“，”卷“：”2“，”作者“：”P Redgrave“，”年份“：”2007“，”非结构化“：”Redgrave，P.：基底神经节。学者传媒2（6），1825（2007）“，”新闻标题“：”基底神经节.学者传媒“}”，{“问题”：“12”，“关键”：“3_CR78”，“doi-asserted-by”：“crossref”，“首页”：“967”，“doi”：“10.1038\/nrn2022”，“volume”：“7”，《作者》：“P Redgrave“，“年份”：“2006年”，“非结构化”：“Redgrave，P，Gurney，K.：短潜伏期多巴胺信号：发现新动作的作用？国家神经科学评论。7（12），967\u2013975（2006）“，“杂志标题”：《神经科学自然评论》。“}，{”key“：”3_CR79“，”doi-asserted-by“：”crossref“，”unstructured“：”Redgrave，P.，Gurney，K.，Stafford，T.，Thirquittle，M.，Lewis，J.：基底神经节在发现新动作中的作用。摘自：Baldasserre，G.，Mirolli，M.（eds.）《自然和人工系统中的内在激励学习》。柏林斯普林格出版社（2012，本卷）“doi”：“10.1007\/978-3642-32375-1_6“}，{“key”：“3_CR80”，“doi-asserted-by”：“crossref”，“first page”：”1009“，“doi”：“10.1016\/S0306-4522（98）00319-4”，“volume”：：“89”，“author”：“P Redgrave”，“year”：“1999”，“unstructured”：“Redgrave，P.，Prescott，T.，Gurney，K.：基底神经节：脊椎动物选择问题的解决方案？Neuroscience 89，1009\u20131023（1999）“，”journal-title“：”Neuroscience“}，{”key“：”3_CR81“，”doi-asserted-by“：”crossref“，”first-page“：”38“，”doi“：”10.3758\/BF03198952“，”volume“：“24”，”author“：”P Reed“，”year“：”1996“，”unstructured“：”Reed，P.，Mitchell，C.，Nokes，T.：工具性两阶段辨别任务中假定中性刺激的内在强化特性。阿尼姆。学习。行为。24，38\u201345（1996）“，“新闻标题”：“动画。学习。行为。“}，{”issue“：“4\u20136”，”key“：“3_CR82”，”doi-asserted-by“：”crossref“，”first page“：”507“，”doi“：”10.1016\/S0893-6080（02）00045-X“，”volume“：15”，”author“：”JN Reynolds“，”year“：”2002“，”unstructured“：”Reynold，J.N.，Wickens，J.R.：皮质纹状体突触的多巴胺依赖性可塑性。神经网络.15（4\u2013），507 \u2013521（2002）“，”新闻标题“：”神经网络。“}，{”issue“：”6“，”key“：”3_CR83“，”doi-asserted-by“：”crossref“，”first page“：“889”，“doi”：“10.1016\/S0896-6273（01）00423-8”，“volume”：“31”，“author”：“G Rizzolatti”，“year”：“2001”，“unstructured”：“Rizzolati，G.，Luppino，G.:皮质运动系统。Neuron 31（6），889\u2013901（2001）”，“journal-title”：“”神经元“}，{”key“：”3_CR84“，”doi-asserted-by“：”crossref“，”第一页“：”112“，”DOI“：”10.1016\/j.brainesrev.2004.09.008“，”volume“：”48“，”author“：”P Romanelli“，”year“：”2005“，”unstructured“：”Romanelly，P.，Esposito，V.，Schaal，D.W.，Heit，G.：基底节的体细胞检查：分离感觉运动通道的实验和临床证据。Brain Res.Rev.48，112\u201328（2005）“，“期刊标题”：“Brain Res Rev.”}，{“key”：“3_CR85”，“volume-title”：“人工智能：现代方法”，“author”：“SJ Russell”，“year”：“2003”，“unstructured”：“Russell，S.J.，Norvig，P.：人工智能：一种现代方法，第二版。Prentice Hall，Upper Saddle River（2003）”，“edition”：“2”}3_CR86“，”doi-asserted-by“：”crossref“，”first page“：”54“，”doi“：”10.1006\/ceps.1999.1020“，“volume”：“25”，“author”：“R Ryan”，“year”：“2000”，“unstructured”：“Ryan，R.，Deci，E.：内在和外在动机：经典定义和新方向。康斯坦普。教育部。精神病。25，54\u201367（2000）“，“新闻标题”：“内容。教育部。精神病。}，{“key”：“3_CR87”，“unstructured”：“Santucci，V.，Baldassarre，G.，Mirolli，M.：生物累积学习需要内在动机：关于视觉引导到达发展的模拟机器人研究。见：第十届表观遗传机器人国际会议论文集，第149卷。隆德大学认知研究，隆德（2010）“}，{“体积-时间”：“设计中的代理2002，第133\u2013149页。Key Centre of Design Computing and Cognition”，“年份”：“2002”，“作者”：“R Saunders”，“密钥”：“3_CR88”，“非结构化”：“Saunders，R.，Gero，J.：好奇的代理和情境设计评估。收录：Gero，J.，Brazier，F.（编辑）Agents In Design 2002，第133\u2013149页。悉尼大学设计计算与认知关键中心（2002）“}，{“Key”：“3_CR89”，“doi-asserted-by”：“crossref”，“unstructured”：“Schembri，M.、Mirolli，M.和Baldassarre，G.：内在激励强化学习机器人的进化和学习。摘自：《人工生命进展》。第九届欧洲人工生命会议记录，LNAI，第4648卷，第294\u2013333页。Springer，Berlin（2007a）“，”DOI“：”10.1007\/978-3-540-74913-4_30“}，{”key“：”3_CR90“，”DOI-asserted-by“：”crossref“，”unstructured“：”Schembri，M.、Mirolli，M.和Baldassarre，G.：内在激励强化学习机器人中儿童期长度和学习参数的演变。摘自：《第七届表观遗传机器人国际会议论文集》，第141\u2013148页。隆德大学认知研究，隆德（2007b）“，”DOI“：”10.1109\/DEVLRN.2007.4354052“}，{“key”：“3_CR91”，“DOI-asserted-by”：“crossref”，“unstructured”：“Schembri，M.、Mirolli，M.和Baldassarre，G.：为一个具有内在动机的强化学习机器人进化内部强化物。见：《第六届国际发展与学习会议记录》，第E1\u2013E6页。伦敦帝国理工学院（2007c）“，”DOI“：”10.1109\/DEVLRN.2007.4354052“}，{”key“：”3_CR92“，”DOI-asserted-by“：”crossref“，”unstructured“：”Schmidhuber，J.：《好奇的建模控制系统》。摘自：《国际神经网络联合会议论文集》，第2卷，第1458\u20131463页。IEEE，新加坡（1991a）“，”DOI“：”10.1109\/IJCNN.1991.170605“}，{”key“：”3_CR93“，”DOI-asserted-by“：”crossref“，”unstructured“：”Schmidhuber，J.：在建模神经控制器中实现好奇心和无聊感的可能性。摘自：《从动物到动画：第一届模拟适应行为国际会议论文集》，第222\u2013227页。麻省理工学院，剑桥（1991b）“，“DOI”：“10.7551\/mitpress\/3115003.0030”}，{“key”：“3_CR94”，“first page”：《579》，“volume-title”：“Advances in Evolutionary Computing”，“author”：“J Schmidhuber”，“year”：“2002”，“unstructured”：“Schmidhuber，J.：探索可预测性。摘自：Ghosh，S.，Tsutsui，T.（eds.）Advances on Evolutionarity Computing，pp.579\u2013612。Springer，Berlin（2002）“}，{”key“：”3_CR95“，”doi-asserted-by“：”crossref“，”unstructured“：”Schmidhuber，J.：“通过创建主观复杂度易于降低的数据来最大化乐趣。In：Baldasserre，G.，Mirolli，M.（eds.）《自然和人工系统中的内在激励学习》。Springer（2012，Berling，本卷）“doi”：“10.1007\/978-3642-32375-1_5“}，{“问题”：“1”，“关键”：“3_CR96”，“doi-asserted-by”：“crossref”，“首页”：“0”，“doi”：“10.1152\/jn.1998.80.1.1”，“卷”：“80”，“作者”：“W Schultz”，“年份”：“1998”，“非结构化”：“Schultz，W.：多巴胺神经元的预测性奖赏信号。神经生理学杂志。80（1），1\u201327（1998）”，“期刊标题：“神经生理学杂志”}，{“key”：“3_CR97“，”doi-asserted-by“：”crossref“，”first page“：”1593“，”doi“：”10.1126\/science.275.5306.1593“，“volume”：“275”，“author”：“W Schultz”，“year”：“1997”，“unstructured”：“Schultz，W.，Dayan，P.，Montague，P.：预测和奖励的神经基质。Science 2751593\u20131599（1997）“，”journal-title“：”Science“}，{”key“：”3_CR98“，”doi-asserted-by“：”crossref“，”first page“：“473”，”doi“：”10.1146\/annurev.neuro.23.1.473“，”volument“：”23“，”author“：”W Schultz“，”year“：”2000“，”unstructured“：”Schultz，W.，Dickinson，A.：预测错误的神经编码。《神经科学年鉴》23，473\ u2013500（2000）“，”新闻标题“：”年度。神经科学版。“｝，｛”键“：”3_CR99“，”卷标题“：”人工科学“，”作者“：”HA Simon“，”年份“：”1996“，”非结构化“：”Simon，H.A.：The Sciences of The Artificial，3rd edn.MIT，Cambridge（1996）“，”版本“：”3“｝，｛”键“：”3_CR100“，”首页“：”323“，”卷“：”8“，”作者“：”SP Singh“，”年份“：”1992“，”非结构化“：”Singh，S.P.：通过编写基本顺序任务的解决方案来转移学习。机器。学习。8，323\u2013339（1992）“，”新闻标题“：”马赫。学习。“｝，｛”issue“：”8“，”key“：”3_CR101“，”doi asserted by“：”crossref“，”first page“：”1352“，”doi“：”10.1162\/098929042304778“，”volume“：”16“，”author“：”S Sirois“，”year“：”2004“，”nonstructured“：”Sirois，S.，Mareschal，D.：婴儿习惯化的交互系统模型。J.Cogn.Neurosci.16（8），1352\u20131362（2004）“，”期刊标题“：”J.Cogn.Neurosci.16（8），1352\u20131362（2004）“sci.“｝，｛”key“：”3_CR102“，”unstructured“：”Storck，J.，Hochreiter，S.，Schmidhuber，J.：非确定性环境中强化驱动的信息获取。In:Proceedings of ICANN\u201995，vol.2，pp.159\u2013164，Paris（1995）“}，{“key”：“3_CR103”，“doi-asserted-by”：“crossref”，“unstructured”：“Stout，A.，Barto，A.G.：能力进步内在动机”。In:Procedues of the 9th International Conference on Development and Learning（ICDL 2010），pp.257\u2013262。美国安娜堡（2010）“，”DOI“：”10.1109\/DEVLRN.2010.5578835“}，{”key“：”3_CR104“，”DOI-asserted-by“：”crossref“，”unstructured“：”Stout，A.，Konidaris，G.D.，Barto，A.G.：内在激励强化学习：发展机器人学习的一个前景广阔的框架。摘自：《AAAI发展机器人春季研讨会论文集》，斯坦福大学（2005），“DOI”：“10.21236\/ADA440079”}，{“volume-title”：“强化学习：简介”，“年份”：“1998”，“作者”：“R Sutton”，“关键”：“3_CR105”，“非结构化”：“Sutton，R.，Barto，A.：强化学习：导论。麻省理工学院，剑桥（1998）”}doi-asserted-by“：”crossref“，”first page“：”181“，“doi”：“10.1016\/S0004-3702（99）00052-1”，“volume”：“112”，“author”：“R Sutton”，“year”：“1999”，“unstructured”：“Sutton，R.，Precup，D.，Singh，S.：在mdps和semimdps之间：强化学习中时间抽象的框架。Artif公司。智力。112，181\u2013211（1999）“，“新闻标题”：“文章。智力。“}，{”key“：”3_CR107“，”first-page“：”9“，”volume“：“3”，”author“：”RS Sutton“，”year“：”1988“，”unstructured“：”Sutton，R.S.：“通过时间差异的方法学习预测。Mach.Learn.3，9\u201344（1988）“，”journal-title“：”Mach.Learn.“内政部”：“10.1046 \/j.1471-4159.1995.65031407.x“，“volume”：“65”，“author”：“M Taber”，“year”：“1995”，“unstructured”：“Taber，M.，Das，S.，Fibiger，H.：皮层下多巴胺释放的皮层调节：通过腹侧被盖区的调节。神经化学杂志。65（3），1407\u20131410（1995）“，“新闻标题”：《神经化学杂志》。“}，{”key“：”3_CR109“，”doi-asserted-by“：”crossref“，”first-page“：”584“，”doi“：”10.1016\/j.neunet.2008.03.008“，”volume“：“21”“，”author“：”j Tani“，”year“：”2008“，”unstructured“：”Tani，J.，Nishimoto，R.，Paine，R.：通过自组织实现2019年的有机组成：脑灵感机器人实验综述。神经网络。21584\u2013603（2008）”，“期刊标题”：“神经网络。“}，{”key“：”3_CR110“，”doi-asserted-by“：”crossref“，”first page“：“1131”，”doi“：”10.1016\/S0893-6080（99）00060-X“，”volume“：：”12“，”author“：”J Tani“，”year“：”1999“，”unstructured“：”Tani，J.，Nolfi，S.：学习感知明确的世界：感觉-运动系统中的分层学习方法。神经网络.12，1131\u20131141（1999）“，”journal-title“：”神经网络。“}，{”issue“：”2“，”key“：”3_CR111“，”doi-asserted-by“：”crossref“，”first-page“：”83“，”doi“：”10.1109\/TAMD.2010.2050205“，“volume”：“2”，“author”：“C Vigorito”，“year”：“2010”，“unstructured”：“Vigoritto，C.，Barto，A.：结构化环境中内在激励的分层技能学习。IEEE Trans.Auton.Mental Dev.2（2），83\u201390（2010）”，“journal-title“：”IEEE Trans。自动。精神发育。“}，{”key“：”3_CR112“，”doi-asserted-by“：”crossref“，”first page“：“599”，”doi“：”10.1126\/science.291.5504.599“，”volume“:”291“，”author“：”J Weng“，”year“：”2001“，”unstructured“：”Weng，J.、McClelland，J.，Pentland，A.、Sporns，O.、Stockman，I.、Sur，M.、Thelen，E.：机器人和动物的自主智力发展。Science 291，599\u2013600（2001）“，”journal-title“：”Science“}，{”key“：”3_CR113“，”doi-asserted-by“：”crossref“，”first-page“：”297“，”doi“：”10.1037\/h0040934“，”volume“：标题“：”精神病。Rev.“}，{”key“：”3_CR114“，”doi-asserted-by“：”crossref“，”first page“：“219”，“doi”：“10.1177\/105971239700600202”，“volume”：“6”，“author”：“M Wiering”，“year”：“1997”，“unstructured”：“Wiering，M.，Schmidhuber，J.：Hq-learning。Adap.Behav.6219\u2013246（1997）”，“日志标题”：“Hq-leaning。Adapp.Behav”}，{“问题”：“11”，“密钥”：“3_CR115”，“doi-asserted-by”：“crossref“，“first page”：“e1000220”，“DOI”：“10.1371”journal.pcbi.1000220“，”volume“：”4“，”author“：”Y Yamashita“，”year“：”2008“，”unstructured“：”Yamashit，Y.，Tani，J.：多时间尺度神经网络模型中功能层次的出现：类人机器人实验。公共科学图书馆计算。生物学4（11），e1000220（2008）“，“期刊标题”：“公共科学图书馆计算”。Biol.“}，{”key“：“3_CR116”，”doi-asserted-by“：”crossref“，”first page“：”464“，”doi“：”10.1038\/nrn1919“，”volume“：‘7’，”author“：”HH Yin“，”year“：”2006“，”unstructured“：”Yin，H.H.H.，Knowlton，B.J.：基底神经节在习惯形成中的作用。Nat.Rev.Neurosci.7，464\u2013476（2006）“，”journal-title“：”Nat.Rev神经科学。“}”，“集装箱运输”：[“自然和人工系统中的内在动机学习“]，“original-title”：[]，“language”：“en”，“link”：[{“URL”：“http://\/link.springer.com/content\/pdf\/10007\/978-3642-32375-1_3”，“content-type”：“unspecified”，“content-version”：“vor”，“intended-application”：“similarity-checking”}]，“deposed”：{“date-parts”：[2024,5,8]]，“date-time”：2024-05-08T03:49:44Z“，”timestamp“：1715140184000}，”score“：1，”resource“：{”primary”：{“URL”：“http://\/link.springer.com/10.1007\/978-3642-32375-1_3”}}，“subtitle”：[“The Knowledge Versus Competence Distinction”]，“short title”：[]，“issued”：{“date-parts”：[[2012,11,10]]}，《国际标准图书编号》：[“9783642323744”，“978364 2323751”“]，”references-count“：115，”URL“：”http:\/\/dx.doi.org\/10.1007\/978-3642-32375-1_3“，”关系“：{}，”主题“：[]，”发布“：{”日期部分“：[[2012,11,10]]}，“断言”：[{“值”：“2012年11月10日”，“顺序”：1，“名称”：“first_online”，“标签”：“首次联机”，“组”：{“名称”:“章节历史”，“标记”：“章节历史“}}]}}