×

变化环境中证据积累的随机模型。 (英语) Zbl 1419.62017号

概述:有机体和生态团体积累证据以作出决定。经典的实验和理论研究探索了在每次试验中确定正确选择时的这一过程。然而,我们生活在一个不断变化的世界。这种无常对决策的经典结果有什么影响?为了解决这个问题,我们使用序列分析来推导出当正确的选项发生时间变化时,证据积累的一个易于处理的模型。我们的分析表明,理想的观测者以由环境波动性决定的速率对先验证据进行贴现,证据积累的动态由平均环境时期获得的信息决定。在不断变化的环境中,最优观测器的一种似是而非的神经实现表明,与以前的模型相比,代表替代选择的神经种群是通过激励耦合的。我们的工作在波动环境中的统计决策和随机非线性动力学之间架起了一座桥梁。

MSC公司:

62C10个 贝叶斯问题;贝叶斯过程的特征
60 H10型 随机常微分方程(随机分析方面)
62升10 顺序统计分析
91E30型 心理物理学和心理生理学;感知
92C20美元 神经生物学
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] R.P.Adams和D.J.MacKay,{贝叶斯在线变化点检测},arXiv预印本,http://arxiv.org/abs/0710.3742arXiv:0710.37422007年。
[2] P.Armitage,{具有两个以上替代假设的序列分析,及其与判别函数分析的关系},J.R.统计学家。Soc.序列号。B、 12(1950年),第137-144页·兹比尔0038.09502
[3] G.Balaízsi、A.van Oudenaarden和J.J.Collins,《细胞决策和生物噪音:从微生物到哺乳动物》,《细胞》,144(2011),第910-925页。
[4] J.M.Beck、W.J.Ma、R.Kiani、T.Hanks、A.K.Churchland、J.Roitman、M.N.Shadlen、P.E.Latham和A.Pouget,《贝叶斯决策的概率人口编码》,《神经元》,60(2008),第1142-1152页。
[5] T.E.Behrens、M.W.Woolrich、M.E.Walton和M.F.Rushworth,《在不确定世界中学习信息的价值》,《国家神经科学》。,10(2007年),第1214-1221页。
[6] P.Billingsley,《概率与测度》,威利出版社,纽约,1995年·Zbl 0822.60002号
[7] S.Bitzer、H.Park、F.Blankenburg和S.J.Kiebel,《感知决策:漂移扩散模型等价于贝叶斯模型》,Front。嗯,神经科学。,8(2014),第102条。
[8] R.Bogacz、E.Brown、J.Moehlis、P.Holmes和J.D.Cohen,《最佳决策的物理学:两种替代性强迫选择任务绩效模型的形式分析》,《心理学》。第113版(2006年),第700-765页。
[9] R.Bogacz和K.Gurney,{基底神经节和皮层在替代行动之间实现最佳决策},神经计算。,19(2007年),第442-477页·Zbl 1122.92006年
[10] R.Bogacz、M.Usher、J.Zhang和J.L.McClelland,《扩展生物启发的选择模型:多重替代、非线性和基于价值的多维选择》,Philos。事务处理。R.Soc.伦敦。B、 362(2007),第1655-1670页。
[11] B.W.Brunton、M.M.Botvinick和C.D.Brody,《大鼠和人类可以为决策积累最佳证据》,《科学》,340(2013),第95-98页。
[12] J.R.Busemeyer和J.T.Townsend,《决策场理论:在不确定环境中进行决策的动态认知方法》,《心理学》。第100版(1993年),第432-59页。
[13] I.D.Couzin、J.Krause、N.R.Franks和S.A.Levin,《迁徙中动物群体的有效领导和决策》,《自然》,433(2005),第513-516页。
[14] T.M.Cover和J.A.Thomas,《信息理论的要素》,John Wiley&Sons出版社,2012年·Zbl 1140.94001号
[15] G.Da Prato和J.Zabczyk,《无限维随机方程》,第二版,《数学百科全书》。申请。152,剑桥大学出版社,英国剑桥,2014年·Zbl 1317.60077号
[16] S.Deneve,{\it Bayesian尖峰神经元I:推理},神经计算。,20(2008),第91-117页·Zbl 1148.92004号
[17] P.Domenici和R.W.Blake,《鱼类快速游泳的运动学和性能》,《实验生物学杂志》。,200(1997),第1165-1178页。
[18] V.Draglia、A.G.Tartakovsky和V.V.Veeravalli,{多假设序贯概率比检验。I.渐近最优性},IEEE Trans。通知。《理论》,45(1999),第2448-2461页·Zbl 1131.62313号
[19] O.Faugeras和J.Inglis,《随机神经场方程:严格的基础》,J.Math。《生物学》(2013),第1-42页·Zbl 1322.60086号
[20] S.Feng、P.Holmes、A.Rorie和W.T.Newsome,{猴子在面对嘈杂刺激和不平等回报时能做出最佳选择吗?},《公共科学图书馆·计算》。《生物学》,5(2009),文章e1000284。
[21] C.W.Gardiner,《物理、化学和自然科学随机方法手册》,第三版,施普林格-弗拉格出版社,柏林,2004年·Zbl 1143.60001号
[22] C.Glaze、J.Kable和J.Gold,《不可预测环境中的规范性证据积累》,《计算与系统神经科学海报》(CoSyne 2015),犹他州盐湖城,2015年。
[23] J.I.Gold和M.N.Shadlen,《班布里斯穆斯与大脑:解读感官刺激、决策和奖励之间的关系》,《神经元》,36(2002),第299-308页。
[24] J.I.Gold和M.N.Shadlen,《决策的神经基础》,《神经科学年鉴》。,30(2007年),第535-74页。
[25] C.Kuehn和M.Riedler,{非局部随机神经场的大偏差},J.Math。神经科学。,4(2014),第1-33页·Zbl 1291.92038号
[26] K.W.Latimer、J.L.Yates、M.L.R.Meister、A.C.Huk和J.W.Pillow,《顶叶皮层的单列棘波序列揭示了决策过程中的离散步骤》,《科学》,349(2015),第184-187页。
[27] C.K.Machens、R.Romo和C.D.Brody,《相互抑制的灵活控制:两区间判别的神经模型》,《科学》,307(2005),第1121-1124页。
[28] J.A.R.Marshall、R.Bogacz、A.Dornhaus、R.Planqueí、T.Kovacs和N.R.Franks,《大脑和社会昆虫群落的最佳决策》,J.R.Soc.Interface,6(2009),第1065-1074页。
[29] J.T.McGuire、M.R.Nassar、J.I.Gold和J.W.Kable,《动态环境中学习速度的功能分离影响》,《神经元》,84(2014),第870-881页。
[30] T.McMillen和P.Holmes,《多重选择的动力学》,J.Math。心理医生。,50(2006年),第30-57页·Zbl 1139.91028号
[31] M.R.Nassar、K.M.Rumsey、R.C.Wilson、K.Parikh、B.Heasly和J.I.Gold,《瞳孔相关唤醒系统对学习动力的理性调节》,《国家神经科学》。,15(2012),第1040-1046页。
[32] J.Neyman和E.Pearson,《关于统计假设的最有效检验问题》,Philos。事务处理。R.Soc.伦敦。A、 231(1933),第289-337页·Zbl 0006.26804号
[33] D.Pais、P.M.Hogan、T.Schlegel、N.R.Franks和N.E.Leonard,{价值敏感决策的机制},《公共科学图书馆·综合》,8(2013),文章e73216。
[34] K.M.Passno、T.D.Seeley和P.K.Visscher,《蜜蜂群体认知》,Behav。经济。社会生物学。,62(2008),第401-414页。
[35] R.Ratcliff,《记忆提取理论》,《心理学》。修订版,85(1978),第59-108页。
[36] R.Ratcliff和P.L.Smith,《两种选择反应时间序列抽样模型的比较》,Psychol。第111版(2004年),第333-367页。
[37] Y.A.Rozanov,《概率论:简明教程》,多佛,纽约,1977年·Zbl 0397.60001号
[38] T.D.Seeley、S.Camazine和J.Sneyd,《蜜蜂的集体决策:蜂群如何选择花蜜来源》,Behav。经济。社会生物学。,28(1991),第277-290页。
[39] A.N.Shiryaev,{最佳停止规则},施普林格,柏林,2007年·Zbl 1138.60008号
[40] M.Shvartsman、V.Srivastava和J.Cohen,《动态环境下的决策理论》,《高级神经信息处理》。系统。,28(2015),第2476-2484页。
[41] P.L.Smith和R.Ratcliff,《简单决策的心理学和神经生物学》,《神经科学趋势》。,27(2004),第161-168页。
[42] L.P.Sugrue、G.S.Corrado和W.T.Newsome,《匹配行为和顶叶皮层的价值表征》,《科学》,304(2004),第1782-1787页。
[43] M.Usher和J.L.McClelland,《感知选择的时间进程:泄漏的竞争累加器模型》,《心理学》。第108版(2001年),第550-592页。
[44] M.Usher和J.L.McClelland,{多重选择动力学模型中的损失厌恶和抑制},心理。第111版(2004年),第757-769页。
[45] A.Wald和J.Wolfowitz,{序贯概率比检验的最佳特征},《数学年鉴》。统计人员。,19(1948年),第326-339页·Zbl 0032.17302号
[46] X.-J.Wang,《皮层回路中缓慢混响的概率决策》,《神经元》,36(2002),第955-968页。
[47] R.C.Wilson、M.R.Nassar和J.I.Gold,{变点问题中风险率的贝叶斯在线学习},神经计算。,22(2010年),第2452-76页·Zbl 1205.68328号
[48] K.-F.Wong、A.C.Huk、M.N.Shadlen和X.-J.Wang,{感知决策过程中时变证据积累背后的神经电路动力学},Front。计算。神经科学。,(2007年),第6条。
[49] A.J.Yu,{最佳变化检测和尖峰神经元},《神经信息处理系统进展》,第19期(NIPS 2006),2007年,第1545-1552页。
[50] Q.Zhao和J.Ye,{多开关过程中的最快检测},IEEE Trans。信号处理。,58(2010),第5994-6006页·兹比尔1392.94680
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。