×

离散状态空间上的主动推理:综合。 (英语) Zbl 1455.91190号

摘要:主动推理是生物或人工智能体中认知、行动、规划、决策和学习的规范原则。从一开始,它的相关过程理论就已经发展到包含复杂生成模型,能够模拟各种复杂行为。由于主动推理的不断发展,常常很难看出其基本原理与过程理论和实际实施之间的关系。在本文中,我们试图通过对离散状态空间模型的主动推理提供完整的数学综合来弥补这一差距。本技术概要概述了该理论,从第一原理导出了神经元动力学,并将该动力学与生物过程联系起来。此外,本文还提供了理解混合生成模型的主动推理所需的基本构件;允许连续的感觉通知离散的表现。本文可用于以下方面:指导针对突出挑战的研究,如何实施主动推理以模拟实验行为的实用指南,或指向可用于进行经验预测的各种硅内神经生理反应的指针。

MSC公司:

91E30型 心理物理学和心理生理学;感知
91E40型 心理学中的记忆和学习
91B06型 决策理论
第62页,共15页 统计学在心理学中的应用
2015年1月62日 贝叶斯推断
90立方厘米 马尔可夫和半马尔可夫决策过程

软件:

PRMLT公司
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿克利,D.H。;辛顿,G.E。;Sejnowski,T.J.,波尔兹曼机器的学习算法,认知科学,9,1,147-169(1985)
[2] 亚当斯,R.A。;斯蒂芬,K.E。;Brown,H.R。;弗里斯,C.D。;Friston,K.J.,《精神病的计算解剖学》,精神病学前沿,4(2013)
[3] 艾奇逊,L。;Lengyel,M.,《有无你:大脑中的预测编码和贝叶斯推理》,《神经生物学的当前观点》,46,219-227(2017)
[4] 艾伦比,G.M。;罗西,体育。;McCulloch,R.E.,《分层贝叶斯模型:从业者指南》,《贝叶斯营销应用杂志》(2005)
[5] Ashby,W.R.,《自组织动力系统原理》,《普通心理学杂志》,37,2,125-128(1947)
[6] Asteröm,K.J.,不完全状态信息下马尔可夫过程的最优控制,数学分析与应用杂志,10(1965)·Zbl 0137.35803号
[7] Attias,H.,《概率推理规划》(第九届国际人工智能与统计研讨会(2003年)),第8页
[8] Barlow,H.B.,《感官信息转换的可能原理》(1961年),麻省理工学院出版社
[9] Barlow,H.,归纳推理、编码、感知和语言,感知,3,2,123-134(1974)
[10] Barlow,H.,《重新审视冗余减少》,《计算与神经系统》,13(2001)
[11] A.巴托。;米罗利,M。;Baldassarre,G.,新奇还是惊喜?,心理学前沿,4(2013)
[12] A.巴托。;Sutton,R.,《强化学习:导论》(1992)
[13] 巴斯托斯,A.M。;Usrey,W.M。;亚当斯,R.A。;Mangun,G.R。;弗里斯,P。;Friston,K.J.,预测编码的标准微电路,神经元,76,4,695-711(2012)
[14] Beal,M.J.,近似贝叶斯推断的变分算法,281(2003)
[15] Benrimoh,D。;帕尔,T。;文森特,P。;亚当斯,R.A。;Friston,K.,主动推理和幻听,计算精神病学,2183-204(2018)
[16] Berger,J.O.,(统计决策理论和贝叶斯分析。统计决策理论与贝叶斯理论分析,统计学中的斯普林格级数(1985),斯普林格-弗拉格:纽约斯普林格)·Zbl 0572.62008号
[17] Bernard,C.,《动物和植物常见生命现象讲座》(1974年),Thomas
[18] 伯恩斯,G.S。;Sejnowski,T.J.,《基底神经节如何作出决定》(Damasio,A.R.;Damasio;H.;Christen,Y.,《决策的神经生物学》,《神经科学中的决策神经生物学、研究与展望》(1996),斯普林格·柏林-海德堡:斯普林格尔·柏林-海德堡-柏林,海德堡),第101-113页
[19] Bishop,C.M.,(模式识别和机器学习,模式识别与机器学习,信息科学与统计(2006),Springer:Springer New York)·兹比尔1107.68072
[20] 布莱,D.M。;库克尔比尔,A。;McAuliffe,J.D.,《变分推断:统计学家评论》,《美国统计协会杂志》,第112、518、859-877页(2017年),arXiv:1601.00670页
[21] Bogacz,R.,《建模感知和学习的自由能量框架教程》,《数学心理学杂志》,76198-211(2017)·Zbl 1396.91638号
[22] Bossaerts,P。;Murawski,C.,《从行为经济学到神经经济学再到决策神经科学:生物学在人类决策研究中的崛起》,《行为科学的当前观点》,5,37-42(2015)
[23] 博特维尼克,M。;Toussant,M.,《作为推理的计划》,《认知科学趋势》,第16、10、485-488页(2012年)
[24] 盒子,G.E.P。;Tiao,G.C.,《从贝叶斯观点看多参数问题》,《数理统计年鉴》(1965年)·Zbl 0151.23306号
[25] Bruineberg,J。;Rietveld,E。;帕尔,T。;van Maanen,L。;Friston,K.J.,《联合作用物-环境系统中的自由能最小化:生态位构建视角》,《理论生物学杂志》,455,161-178(2018)·Zbl 1406.92654号
[26] 巴克利,C.L。;Kim,C.S。;McGregor,S。;Seth,A.K.,《行动和感知的自由能原理:数学综述》,《数学心理学杂志》,81,55-79(2017)·Zbl 1397.91535号
[27] Buschman,T.J。;Miller,E.K.,《转移注意力的焦点:认知中离散计算的证据》,人类神经科学前沿,4(2010)
[28] Carpenter,G.A。;Grossberg,S.,自组织神经模式识别机的大规模并行架构,计算机视觉、图形和图像处理,37,1,54-115(1987)·Zbl 0634.68089号
[29] 圣母玛利亚,O。;Nauta,J。;Verbelen,T。;西蒙斯,P。;Dhoedt,B.,使用主动推理的贝叶斯政策选择(2019),arXiv:1904.08149[cs]arXiv:1904.08149
[30] 赵,Z.C。;Takaura,K。;Wang,L。;北富士。;Dehaene,S.,《灵长类大脑分层预测和预测误差的大尺度皮层网络》,神经元,100,5,1252-1266.e3(2018)
[31] Claeskens,G。;Hjort,N.L.,模型选择和模型平均(2006),剑桥大学出版社
[32] 柯南特,R.C。;Ashby,W.R.,《系统的每一个好的调节器都必须是该系统的模型》,《国际系统科学杂志》,第1期,第2期,第89-97页(1970年)·Zbl 0206.14602号
[33] 常数,A。;拉姆斯特德,M。;Veissière,S.P.L.公司。;J.O.坎贝尔。;Friston,K.,《生态位构建的变化方法》,《皇家学会界面杂志》,第15期,第141页,第20170685条,pp.(2018)
[34] 常数,A。;拉姆斯特德,M.J.D。;韦西埃,S.P.L。;Friston,K.,《期望机制:社会整合和人类决策的积极推理模型》,《心理学前沿》,第10期(2019年)
[35] M.卡伦。;戴维,B。;Friston,K.J。;Moran,R.J.,《openai健身房中的主动推理:精神疾病计算研究的范式》,《生物精神病学:认知神经科学和神经成像》,3,9,809-818(2018)
[36] Da Costa,L。;Sajid,N。;帕尔,T。;Friston,K。;Smith,R.,《动态规划和主动推理之间的关系:离散有限水平情况》(2020年)
[37] Dan,Y。;艾迪克·J·J。;Reid,R.C.,《外侧膝状体核内自然场景的有效编码:计算理论的实验测试》,《神经科学杂志》,16,10,3351-3362(1996)
[38] Dauwels,J.,《因子图上的变分信息传递》(2007年IEEE信息理论国际研讨会,IEEE:IEEE Nice),2546-2550
[39] Dauwels,J。;维亚拉特,F。;拉特科夫斯基,T。;Cichocki,A.,《通过消息传递测量神经同步性》(NIPS(2007))
[40] Daw,N.D。;Gershman,S.J。;西摩,B。;达扬,P。;Dolan,R.J.,《基于模型对人类选择的影响和纹状体预测误差》,《神经元》,69,6,1204-1215(2011)
[41] Daw,N.D。;奥多尔蒂,J.P。;达扬,P。;西摩,B。;Dolan,R.J.,《人类探索性决策的皮层基质》,《自然》,4417095876-879(2006)
[42] 达扬,P。;辛顿,G.E。;尼尔·R·M。;Zemel,R.S.,亥姆霍兹机器,神经计算,7,5,889-904(1995)
[43] Deci,E。;Ryan,R.M.,(人类行为的内在动机和自决。人类行为的固有动机和自决,社会心理学的观点(1985),斯普林格美国)
[44] 德科,G。;Jirsa,V.K。;Robinson,宾夕法尼亚州。;Breakspear,M。;Friston,K.,《动态大脑:从尖峰神经元到神经团和皮层场》,《公共科学图书馆·计算生物学》,第4、8期,文章e1000092 pp.(2008)
[45] Dehaene,S。;Meyniel,F。;Wacongne,C.公司。;Wang,L。;Pallier,C.,《序列的神经表示:从转移概率到代数模式和语言树》,《神经元》,88,1,2-19(2015)
[46] 丁·L。;Gold,J.I.,《基底神经节对感知决策的贡献》,《神经元》,79,4,640-649(2013)
[47] 邓肯,J。;Ward,R。;夏皮罗,K.,《人类视觉中注意力停留时间的直接测量》,《自然》,369,6478,313-315(1994)
[48] Eichenbaum,H。;Dudchenko,P。;伍德,E。;夏皮罗,M。;Tanila,H.,海马体、记忆和位置细胞:是空间记忆还是记忆空间?,《神经元》,23,2,209-226(1999)
[49] 菲茨杰拉德,T.H.B。;多兰·R·J。;Friston,K.J.,《模型平均、最优推理和习惯形成》,人类神经科学前沿,8(2014)
[50] 菲茨杰拉德,T.H.B。;多兰,R.J。;Friston,K.,《多巴胺、奖励学习和主动推理》,计算神经科学前沿,9(2015)
[51] 菲茨杰拉德,T.H.B。;莫兰·R·J。;Friston,K.J。;Dolan,R.J.,证据积累期间人类后顶叶皮层的精确性和神经元动力学,NeuroImage,107,219-228(2015)
[52] 菲茨杰拉德,T.H.B。;施瓦滕贝克,P。;驼峰,M。;多兰·R·J。;Friston,K.,主动推理、证据积累和瓮任务,神经计算,27,2,306-328(2015)·Zbl 1414.92091号
[53] 弗莱明,W.H。;Sheu,S.J.,风险敏感控制和最优投资模型II,应用概率年鉴,12,2,730-767(2002)·Zbl 1074.93038号
[54] Fonollosa,J。;Neftci,E。;Rabinovich,M.,《认知和行为中的组块序列学习》,《公共科学图书馆·计算生物学》,11,11,文章e1004592 pp.(2015)
[55] Friston,K.,《大脑中的层次模型》,《公共科学图书馆·计算生物学》,第4、11页,第1000211页(2008年)
[56] Friston,K.,《自由能源原则:大脑的粗略指南?》?,认知科学趋势,13,7,293-301(2009)
[57] Friston,K.,《自由能量原理:统一的大脑理论?》?,《自然评论神经科学》,11,2,127-138(2010)
[58] Friston,K.,《贝叶斯大脑未来的历史》,NeuroImage,62,21230-1233(2012)
[59] Friston,K.,《特定物理的自由能原理》,148(2019),BioArxiv
[60] Friston,K。;亚当斯,R。;Montague,R.,什么是价值累积奖励或证据?,神经机器人领域的前沿,6(2012年)
[61] Friston,K。;Buzsáki,G.,《时间的功能解剖:大脑中的什么和什么时候,认知科学趋势》,20,7,500-511(2016)
[62] Friston,K。;Da Costa,L。;哈夫纳,D。;Hesp,C。;Parr,T.,复杂推理(2020),arXiv:2006.04120[cs,q-bio]。arXiv:2006.04120年
[63] Friston,K.J。;道尼佐,J。;Kiebel,S.J.,强化学习或主动推理?,《公共科学图书馆·综合》,4、7,文章e6421 pp.(2009)
[64] Friston,K。;菲茨杰拉德,T。;Rigoli,F。;施瓦滕贝克,P。;奥多尔蒂,J。;Pezzulo,G.,《主动推理与学习》,《神经科学与生物行为评论》,68,862-879(2016)
[65] Friston,K。;菲茨杰拉德,T。;Rigoli,F。;施瓦滕贝克,P。;Pezzulo,G.,《主动推理:过程理论》,神经计算,29,1,1-49(2017)·Zbl 1414.92092号
[66] Friston,K。;哈里森,L。;Penny,W.,《动态因果建模》,《神经影像》,第19、4、1273-1302页(2003年)
[67] Friston,K。;Kiebel,S.,自由能原理下的预测编码,《皇家学会哲学学报》,B辑(生物科学),3641521211-1221(2009)
[68] Friston,K。;Kilner,J。;Harrison,L.,《大脑的自由能原理》,《生理学杂志》(巴黎),100,1-3,70-87(2006)
[69] Friston,K.J。;林,M。;弗里斯,C.D。;佩祖洛,G。;霍布森,J.A。;Ondobaka,S.,《主动推理、好奇心和洞察力》,神经计算,29,10,2633-2683(2017)·Zbl 1414.91320号
[70] Friston,K。;Mattout,J。;北卡罗来纳州Trujillo-Barreto。;阿什伯恩,J。;Penny,W.,变分自由能和拉普拉斯近似,《神经影像》,34,1,220-234(2007)
[71] Friston,K.J。;帕尔,T。;de Vries,B.,《图形大脑:信念传播和主动推理》,《网络神经科学》,第1期,第4期,第381-414页(2017年)
[72] Friston,K。;帕尔,T。;Zeidman,P.,贝叶斯模型简化(2018),arXiv:1805.07092[stat]。arXiv:1805.07092
[73] Friston,K。;Penny,W.,《事后贝叶斯模型选择》,NeuroImage,56,4,2089-1999(2011)
[74] Friston,K。;Rigoli,F。;Ognibene,D。;Mathys,C。;菲茨杰拉德,T。;Pezzulo,G.,主动推理和认知价值,认知神经科学,6,4,187-214(2015)
[75] Friston,K.J。;Rosch,R。;帕尔,T。;价格,C。;Bowman,H.,深度时间模型和主动推理,《神经科学与生物行为评论》,90,486-5101(2018)
[76] Friston,K.J。;Sajid,N。;Quiroga-Martinez,D.R。;帕尔,T。;普赖斯,C.J。;霍姆斯,E.,《积极倾听》(2020年),bioRxiv,2020.03.18.997122
[77] Friston,K。;萨莫特拉基斯,S。;Montague,R.,《主动推理与代理:无成本函数的最优控制》,生物控制论,106,8,523-541(2012)·Zbl 1267.90167号
[78] Friston,K。;施瓦滕贝克,P。;菲茨杰拉德,T。;驼峰,M。;Behrens,T。;Dolan,R.J.,《选择的解剖:多巴胺与决策》,《皇家学会哲学学报》,B辑(生物科学),3691655(2014)
[79] Friston,K.J。;Stephan,K.E.,《自由能源与大脑》,合成酶,159,3,417-458(2007)
[80] Fuster,J.M.,《前额叶皮层与感知-行动周期中时间间隙的桥接》,《纽约科学院年鉴》,608318-329(1990),讨论330-336
[81] George,D.,《作为皮层微电路组织原则的信念传播和布线长度优化》(2005)
[82] Gershman,S.J。;Niv,Y.,《学习潜在结构:在其关节处雕刻自然》,《神经生物学的当前观点》,20,2,251-256(2010)
[83] Gregory,R.L.,《作为假设的感知》,伦敦皇家学会哲学学报。B辑,生物科学,29010381-197(1980)
[84] Haber,S.N.,《灵长类基底神经节:平行和整合网络》,《化学神经解剖学杂志》,26,4,317-330(2003)
[85] Haken,H.(协同学:物理学、化学和生物学中的非平衡相变和自组织导论。协同学:物理学、化学和生物学中的非平衡相变和自组织导论,协同学中的施普林格系列(1978),施普林格-维拉格:施普林格-维拉格柏林-海德堡)·Zbl 0396.93001号
[86] Hanslmayr,S。;沃尔伯格,G。;温伯,M。;Dalal,S.S。;Greenlee,M.W.,《7赫兹门皮层信息流和视觉感知的前刺激振荡期》,《当代生物学》,23,22,2273-2278(2013)
[87] Haruno,M。;Wolpert,D。;Kawato,M.,动作生成的层次MOSAIC(2003)
[88] von Helmholtz,H。;Southall,J.P.C.,亥姆霍兹关于生理光学的论文(1962年),多佛出版物:纽约多佛出版物,OCLC:523553
[89] Heskes,T.,有效最小化Bethe和Kikuchi自由能的凸性论证,人工智能研究杂志,26,153-190(2006)·Zbl 1182.68326号
[90] 辛顿,G。;达扬,P。;弗雷,B。;Neal,R.,《无监督神经网络的“唤醒-休眠”算法》,《科学》,26852141158-1161(1995)
[91] 霍布森,J。;Friston,K.,《觉醒和梦境意识:神经生物学和功能考虑》,《神经生物学进展》,98,1,82-98(2012)
[92] 霍布森,J.A。;洪,C.C.-H。;Friston,K.J.,《梦境中的虚拟现实和意识推理》,《心理学前沿》,5(2014)
[93] Hohwy,J.,自我证明的大脑,Noûs,50,2259-285(2016)
[94] Howard,R.A.,信息价值理论,IEEE系统科学与控制论汇刊,2,1,22-26(1966)
[95] Huys,Q.J.M。;埃舍尔,N。;O'Nions,E。;谢里丹,L。;达扬,P。;Roiser,J.P.,《你脑海中的盆景树:巴甫洛夫系统如何通过修剪决策树塑造目标导向的选择》,《公共科学图书馆·计算生物学》,第8、3期,第1002410页,(2012)
[96] Iglesias,S。;Mathys,C。;布罗德森,K.H。;卡斯珀,L。;Piccirelli,M。;den Ouden,H.E.M。;Stephan,K.E.,《感觉学习期间中脑和基底前脑的分层预测误差》,《神经元》,80,2,519-530(2013)
[97] Itti,L。;Baldi,P.,《贝叶斯惊喜吸引人类注意力》,《视觉研究》,49,10,1295-1306(2009)
[98] 伊蒂,L。;科赫,C。;Niebur,E.,用于快速场景分析的基于盐度的视觉注意模型,IEEE模式分析和机器智能汇刊,20,11,1254-1259(1998)
[99] Jahanshahi,M。;奥贝索,I。;罗思韦尔,J.C。;Obeso,J.A.,《目标定向和习惯性抑制的额叶-纹状体-丘脑-丘脑网络》,《自然评论》。神经科学,16,12,719-732(2015)
[100] Jaynes,E.T.,《信息理论和统计力学》,《物理评论》,106,4,620-630(1957)·Zbl 0084.43701号
[101] M.I.乔丹。;加赫拉马尼,Z。;Jaakkola,T.S。;Saul,L.K.,《图形模型变分方法简介》(Jordan,M.I.,《图形模式学习》(1998),施普林格荷兰:施普林格荷属多德雷赫特),105-161·Zbl 0910.68175号
[102] M.I.乔丹。;加赫拉马尼,Z。;Saul,L.K.,《隐马尔可夫决策树》(1997)
[103] Kahneman,D。;Tversky,A.,(前景理论:风险下的决策分析。前景理论:对风险下的决定、决策、概率和效用的分析:选读(1988),剑桥大学出版社:剑桥大学出版社,纽约州纽约市,美国)
[104] 卡普兰,R。;Friston,K.J.,作为主动推理的规划和导航,生物控制论,112,4,323-343(2018)·Zbl 1400.92607号
[105] Kauder,E.,《边际效用理论的起源:从亚里士多德到十八世纪末》,《经济杂志》,63,251,638-650(1953)
[106] 考夫曼,S.A.,《秩序的起源:进化中的自我组织和选择》(1993),牛津大学出版社
[107] Kirchhoff,M。;帕尔,T。;帕拉西奥斯,E。;Friston,K。;Kiverstein,J.,《生命的马尔可夫毯子:自主、主动推理和自由能原理》,《皇家学会界面杂志》,第15期,第138页,第20170792条,pp.(2018)
[108] 尼尔,D.C。;Pouget,A.,《贝叶斯大脑:不确定性在神经编码和计算中的作用》,《神经科学趋势》,27,12,712-719(2004)
[109] Kullback,S。;Leibler,R.A.,《论信息与充分性》,《数理统计年鉴》,22,179-86(1951)·Zbl 0042.38403号
[110] Kurt,B.,两个Dirichlet(和Beta)分布之间的Kullback-leibler分歧(2013)
[111] 兰道,A.N。;Fries,P.,《注意力有节奏地取样刺激》,《当代生物学》,22,11,1000-1004(2012)
[112] Lewicki,M.S.,自然声音的有效编码,《自然神经科学》,5,4,356-363(2002)
[113] Lindley,D.V.,《关于实验所提供信息的测量》,《数理统计年鉴》,27,4,986-1005(1956)·Zbl 0073.14103号
[114] Linsker,R.,《感知神经组织:基于网络模型和信息理论的一些方法》,《神经科学年度评论》,13,1,257-281(1990)
[115] Loeliger,H.-A.,因子图简介,IEEE信号处理杂志(2004)
[116] Luck,S.J。;Vogel,E.K.,特征和连词的视觉工作记忆能力,《自然》,390,6657,279-281(1997)
[117] Lundqvist,M。;罗斯,J。;赫尔曼,P。;Brincat,S.L。;Buschman,T.J。;Miller,E.K.,工作记忆的伽马和贝塔爆发,神经元,90,152-164(2016)
[118] Maass,W.,《论winner-take-all的计算能力》,神经计算,12,11,2519-2535(2000)
[119] 麦凯,D.J.C.,《主动数据选择的基于信息的目标函数》,神经计算,4,4,590-604(1992)
[120] MacKay,D.,一种用于解码和密码分析的自由能量最小化算法(电子信件(1995))
[121] 麦凯,D.J.C.,《信息理论、推理和学习算法》(2003),剑桥大学出版社:英国剑桥大学出版社;纽约·Zbl 1055.94001号
[122] 马雷罗斯,A.C。;道尼佐,J。;Kiebel,S.J。;Friston,K.J.,《人口动力学:方差和乙状结肠激活功能》,《神经影像》,42,1,147-157(2008)
[123] McKay,R.T。;Dennett,D.C.,错误信念的演变,《行为与脑科学》,32,6,493-510(2009),讨论510-561
[124] Millidge,B.,《实施预测处理和主动推理:初步步骤和结果》,Preprint(2019),PsyArXiv
[125] 米尔扎,M.B。;亚当斯,R.A。;数学博士。;Friston,K.J.,场景构建、视觉觅食和主动推理,计算神经科学前沿,10(2016)
[126] 米尔扎,M.B。;亚当斯,R.A。;Mathys,C。;Friston,K.J.,《人类视觉探索减少了感知世界的不确定性》,《PLOS ONE》,13,1,Article e0190429 pp.(2018)
[127] 米尔扎,M.B。;亚当斯,R.A。;帕尔,T。;Friston,K.,冲动和主动推理,认知神经科学杂志,31,2202-220(2019)
[128] 莫兰,R。;Pinotsis,D.A。;Friston,K.,《动态因果建模中的神经质量和领域》,计算神经科学前沿,7(2013)
[129] 穆图西斯,M。;新泽西州Trujillo-Barreto。;El-Deredy,W。;多兰·R·J。;Friston,K.J.,《人际推理的正式模型》,《人类神经科学的前沿》,8(2014)
[130] 尼科利斯,G。;Prigogine,I.,《非平衡系统中的自组织:从耗散结构到涨落中的秩序》(1977),Wiley-Blackwell:Wiley-Brackwell,纽约·Zbl 0363.93005号
[131] 奥基夫,J。;Dostrovsky,J.,《海马体作为空间地图》。自由运动大鼠单位活动的初步证据,脑研究,34,1,171-175(1971)
[132] Olshausen,B.A。;Field,D.J.,感觉输入的稀疏编码,《神经生物学的当前观点》,14,4,481-487(2004)
[133] Olshausen,B.A。;O'Connor,K.N.,《声音的新窗口》,《自然神经科学》,第5、4、292-294页(2002年)
[134] 光学,L.M。;Richmond,B.J.,灵长类下颞皮层中单个单位对二维模式的时间编码。III、 信息论分析,《神经生理学杂志》,57,1162-178(1987)
[135] Oudeyer,P.-Y。;卡普兰,F.,什么是内在动机?计算方法的类型学,神经机器人学的前沿,1(2009)
[136] Parr,T.,《主动视觉的计算神经学》(2019年),伦敦大学学院:伦敦大学学院,(博士)
[137] 帕尔,T。;Benrimoh,D.A。;文森特,P。;Friston,K.J.,《精确性和虚假感知推理》,《综合神经科学前沿》,12(2018)
[138] 帕尔,T。;Da Costa,L。;Friston,K.,Markov毯子,信息几何和随机热力学,伦敦皇家学会哲学学报A(数学和物理科学),378,2164,第20190159页,(2020)·Zbl 1462.82051号
[139] 帕尔,T。;Friston,K.J.,《不确定性、认识论和主动推理》,《皇家学会界面杂志》,第14期,第136页(2017年)
[140] 帕尔,T。;Friston,K.J.,《主动推理中的工作记忆、注意力和显著性》,《科学报告》,第7期,第1期,第14678页(2017年)
[141] 帕尔,T。;Friston,K.J.,《主动推断与眼动解剖学》,《神经心理学》,111334-343(2018)
[142] 帕尔,T。;Friston,K.J.,《推理的解剖:生成模型和大脑结构》,计算神经科学前沿,12(2018)
[143] 帕尔,T。;Friston,K.J.,《视觉忽视的计算解剖学》,《大脑皮层》(纽约:1991),28,2,777-790(2018)
[144] 帕尔,T。;Friston,K.J.,《离散和连续的大脑:从决策到行动再回来》,《神经计算》,30,9,2319-2347(2018)·Zbl 1472.92035号
[145] 帕尔,T。;Friston,K.J.,眼动的计算药理学,精神药理学(2019)
[146] 帕尔,T。;马尔科维奇(D.Markovic)。;Kiebel,S.J。;Friston,K.J.,使用平均场、bethe和边缘近似的神经元信息传递,科学报告,9,1889(2019)
[147] 帕尔,T。;Rees,G。;Friston,K.J.,计算神经心理学和贝叶斯推断,人类神经科学前沿,12(2018)
[148] 帕尔,T。;Rikhye,R.V。;Halassa,M.M。;Friston,K.J.,作为主动推理的前额叶计算,《大脑皮层》(2019),bhz118 e0190429 e12112 e37454
[149] Pearl,J.,智能系统中的概率推理(1988)
[150] Pearl,J.,概率和因果推理的图形模型,(Smets,P.,不确定性和不精确性的量化表示。不确定性和非精确性的定量表示,不可行推理和不确定性管理系统手册(1998),施普林格荷兰:施普林格荷属多德雷赫特),367-389·Zbl 0933.03020号
[151] Penny,W.,正常密度岩、伽马密度岩、Dirichlet密度岩和wishart密度岩的KL扩散(2001)
[152] 彼得森,K.B。;Pedersen,M.S.,《矩阵食谱》(2012)
[153] Rao,R.P.N。;Ballard,D.H.,《视觉皮层中的预测编码:一些超经典感受野效应的功能解释》,《自然神经科学》,第2期,第179-87页(1999年)
[154] 里弗迪,P。;斯利瓦斯塔瓦,V。;Leonard,N.E.,《广义高斯多武装匪徒的人类决策建模》(2013),arXiv:1307.6134[cs,math,stat]arXiv:1307.6134
[155] 里森胡贝尔,M。;Poggio,T.,皮层物体识别的层次模型,《自然神经科学》,2,11,1019-1025(1999)
[156] 罗尔斯,E.T。;Tovee,M.J.,《大脑皮层的处理速度和视觉掩蔽的神经生理学》,伦敦皇家学会学报,B辑,257,1348,9-15(1994)
[157] Salakhutdinov,R。;Hinton,G.,深度玻尔兹曼机的有效学习程序,神经计算,24,81967-2006(2012)·Zbl 1247.68223号
[158] 销售,A.C。;Friston,K.J。;琼斯,M.W。;Pickering,A.E。;Moran,R.J.,预测错误的位置-共规则跟踪优化了认知灵活性:主动推理模型,第340620条,pp.(2018),bioRxiv
[159] Schmidhuber,J.,《开发机器人、最佳人工好奇心、创造力、音乐和美术》,《连接科学》,第18、2、173-187页(2006年)
[160] Schmidhuber,J.,《创造力、乐趣和内在动机的形式理论》(1990年-2010年),《IEEE自主心理发展汇刊》,第2期,第3期,第230-247页(2010年)
[161] 施瓦滕贝克,P。;菲茨杰拉德,T。;多兰·R·J。;Friston,K.,《探索、新奇、惊喜和自由能最小化》,心理学前沿,4(2013)
[162] 施瓦滕贝克,P。;菲茨杰拉德,T.H.B。;Mathys,C。;杜兰,R。;Friston,K.,《多巴胺能中脑编码期望结果的预期确定性》,《大脑皮层》(纽约:1991),25,10,3434-3445(2015)
[163] 施瓦滕贝克,P。;菲茨杰拉德,T.H.B。;Mathys,C。;多兰,R。;Kronbichler,M。;Friston,K.,《选择行为中惊喜最小化超过价值最大化的证据》,《科学报告》,516575(2015)
[164] 施瓦滕贝克,P。;菲茨杰拉德,T.H.B。;Mathys,C。;杜兰,R。;伍斯特,F。;Kronbichler,M。;Friston,K.,《次优模型的最优推理:成瘾和主动贝叶斯推理》,《医学假设》,84,2,109-117(2015)
[165] Schwöbel,S。;Kiebel,S。;Marković,D.,主动推理、信念传播和贝特近似,神经计算,30,9,2530-2567(2018)·Zbl 1471.91411号
[166] Sengupta,B。;Friston,K.,《作为规范理论的近似贝叶斯推断》(计算生物学研讨会,第14卷(2016年)),第1002400页,arXiv:1705.06614
[167] Sengupta,B。;托齐,A。;库雷,G.K。;道格拉斯,P.K。;Friston,K.J.,《迈向神经元计量理论》,《PLOS生物学》,第14、3期,第1002400页,(2016)
[168] Sharot,T.,《乐观主义偏见》,《当代生物学》,21,23,R941-R945(2011)
[169] 史密斯,R。;Kirlic,N。;Stewart,J.L。;Touthang,J。;Kuplicki,R。;Khalsa,S.S。;保卢斯,M.P。;研究人员,T。;Aupperle,R.,在接近-回避冲突期间,转诊患者样本的决策不确定性更大:计算建模方法Preprint(2020),PsyArXiv
[170] 史密斯,R。;施瓦滕贝克,P。;帕尔,T。;Friston,K.J.,《概念学习的主动推理模型》,第633677页(2019年),bioRxiv
[171] 史密斯,R。;施瓦滕贝克,P。;Stewart,J.L。;Kuplicki,R。;Ekhtiari,H。;研究人员,T。;Paulus,M.P.,《物质使用障碍中的不精确行为选择:解决探索性困境时主动学习障碍的证据》,预印本(2020年),PsyArXiv
[172] Stephan,K.E。;佩尼,W.D。;道尼佐,J。;莫兰·R·J。;Friston,K.J.,小组研究的贝叶斯模型选择,NeuroImage,46,4,1004-1017(2009)
[173] Stone,J.V.,《人工智能引擎:深度学习数学入门教程》(2019年)
[174] 孙,Y。;戈麦斯,F。;Schmidhuber,J.,《惊喜计划:动态环境中的最优贝叶斯探索》(2011),arXiv:1103.5708[cs,stat]。arXiv:1103.5708
[175] Tanaka,T.,平均场近似理论,10(1999)
[176] T,J。;泰勒,D.P.,大脑中的信息是以连续形式还是离散形式表示的?(2018),arXiv:1805.01631[cs,math,q-bio]arXiv:1805.01631
[177] Tervo,D.G.R。;Tenenbaum,J.B。;Gershman,S.J.,走向结构学习的神经实现,《神经生物学的当前观点》,37,99-105(2016)
[178] Thibaut,F.,基底神经节在决策中起着关键作用,《临床神经科学对话》,18,1,3(2016)
[179] Todorov,E.,最优控制和估计之间的一般对偶性,(2008年第47届IEEE决策和控制会议(2008年)),4286-4292
[180] 托多罗夫,E。;Jordan,M.I.,作为运动协调理论的最优反馈控制,《自然神经科学》,5,11,1226-1235(2002)
[181] Tschantz,A。;巴尔的里,M。;赛斯,A.K。;巴克利,C.L.,《量表主动推理》(2019),arXiv:1911.106011911.10601[cs,eess,math,stat]arXiv:1911.10601-
[182] 范登·布鲁克,B。;威格林克,W。;Kappen,B.,风险敏感路径积分控制,(UAI(2010))
[183] 文森特,P。;帕尔,T。;Benrimoh,D。;Friston,K.J.,《着眼于不确定性:模拟瞳孔对环境波动的反应》,《公共科学图书馆·计算生物学》,第15、7期,第1007126页,(2019)
[184] 冯·贝凯(Von Békésy,G.),《感觉抑制》(1967),普林斯顿大学出版社
[185] 冯·诺依曼,J。;Morgenstern,O.,《博弈与经济行为理论》,(《博弈与经济行为理论》(1944),普林斯顿大学出版社:普林斯顿大学出版社,美国新泽西州普林斯顿)·Zbl 0063.05930号
[186] 怀特,C.C.,《马尔可夫决策过程》(《运筹学与管理科学百科全书》(2001年),美国施普林格:美国马萨诸塞州波士顿施普林格),484-486
[187] Winn,J。;Bishop,C.M.,变分消息传递,《机器学习研究杂志》,34(2005)·Zbl 1222.68332号
[188] 吴昌明。;舒尔茨,E。;Speekenbrink,M。;Nelson,J.D。;Meder,B.,《泛化指导人类在广阔决策空间中的探索》,《自然-人类行为》,第2期,第12期,第915-924页(2018年)
[189] Xitong,Y.,《理解变分下限》(2017),高级计算机研究所。马里兰大学
[190] Yedidia,J。;弗里曼,W。;Weiss,Y.,构建自由能量近似和广义置信传播算法,IEEE信息理论汇刊,51,7,2282-2312(2005)·Zbl 1283.94023号
[191] 张伟。;Luck,S.J.,《视觉工作记忆中的离散固定分辨率表征》,《自然》,453,7192,233-235(2008)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。