跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
神经科学杂志。2011年4月27日;31(17): 6339–6352.
预防性维修识别码:PMC3356114型
NIHMSID公司:NIHMS291970
PMID:21525274

感知决策任务中决策时间对先验概率权重的影响

摘要

决策通常基于新证据与可能的最佳选择的事先知识的组合。最佳组合需要了解证据的可靠性,但在许多现实情况下,这是未知的。在这里,我们提出并测试了一个新的理论:大脑利用决策形成过程中经过的时间,将感官证据与先验概率相结合。经过的时间很有用,因为(1)延迟的决策往往来自不太可靠的证据,以及(2)在给定决策时间的预期准确性取决于到那时为止收集到的证据的可靠性。这些规律使大脑能够将先前的信息与感觉证据结合起来,根据可靠性对后者进行加权。为了验证这一理论,当受试者使用一系列不同的刺激可靠性对运动方向进行反应时辨别时,我们操纵了奖励选择的先验概率。该理论解释了在各种刺激强度下,先验概率对选择和反应时间的影响。我们发现,先验概率作为一个随决策时间增加的动态偏差信号被纳入决策过程。这种偏差信号取决于人类受试者的速度-准确性设置,它反映在执行这项任务的恒河猴顶叶外侧区(LIP)神经元的放电率中。

介绍

决策是一个综合的过程,它结合了证据、先验知识以及预期的回报和成本。概率或其他一些信念度量为组合这些因素提供了一个通用框架(Jaynes,2003年). 因此,有人建议对大脑中的感觉信号进行概率评估(巴洛,1969年;卡彭特和威廉姆斯,1995年;Zemel等人,1998年;饶,2004;Jazayeri和Movshon,2006年;Ma等人,2006年;Gold and Shadlen,2007年;Beck等人,2008年). 最终,影响决策的综合信息似乎在单个神经元的水平上收敛(Platt和Glimcher,1999年;Schall和Thompson,1999年;Glimcher,2003年;Romo等人,2004年;Sugrue等人,2004年;Gold and Shadlen,2007年;Platt和Huettel,2008年;Rorie等人,2010年). 总之,这些想法表明大脑中的神经元将概率信号组合成一个决策变量(DV)。这就提出了一个问题,即大脑如何将峰值频率转换为概率单位或置信度单位。在其最基本的形式中,这可以通过检查DV的神经表示如何结合与先验知识(即先验概率)相关的概率来解决。

将先验概率纳入决策过程的主流理论涉及DV或决策规则的固定变化(爱德华兹,1965年;Link and Heath,1975年;卡彭特和威廉姆斯,1995年;Gold等人,2008年;Ratcliff和McCooon,2008年;Simen等人,2009年). 与这些理论相一致,先验概率在大脑中有一个静态表征(Basso和Wurtz,1998年;Platt和Glimcher,1999年). 然而,尚不清楚大脑是如何将这种先验概率表征与其他信息来源结合起来的,这可能或多或少会对决策产生影响。一些信息源比其他信息源更可靠。例如,从两个装有90:10红/白球混合物的瓮中的一个瓮中连续抽取两个红球,这是一个可靠的线索,表明该瓮中含有更多的红球。相反,如果骨灰缸中含有55:45的混合物,同样的证据就不那么可靠了。这是决策者的常见情况:除了假设的不确定性外,证据的可靠性也存在不确定性。

我们建议,当受试者根据可靠性未知的证据流进行审议时,大脑可以利用决策过程的经过时间,将先验概率与证据的表示结合起来,从而在证据不太可靠的情况下降低证据的权重。许多决策可以通过证据积累到标准水平或“界限”来解释。如果证据和界限共享概率单位,则后者将确定正确决策的概率,而不管决策时间或刺激强度如何。较强和较弱的刺激将导致更快和较慢的概率累积到相同的水平,并且决策准确性不取决于经过的时间。

然而,更典型的情况是,与较弱的刺激相比,较强的刺激会导致更快、更准确的选择(Link,1992年;Ratcliff和Rouder,1998年;Ratcliff和Smith,2004年;Palmer等人,2005年)如心理测量功能所示。因此,界限并不代表一个固定的概率值,而是代表其他一些量的阈值,例如神经活动。根据刺激因素,界限代表正确选择的不同概率。累积证据和正确选择概率之间的关系随着决策时间的推移而变化。因此,当考虑混合可靠性的刺激因素时,平均而言,更快的决策与更可靠的证据相关,而较慢的决策与不太可靠的证据有关。

原则上,当将先验概率与累积的感官证据相结合时,大脑可以利用这种关系。在更短的决策时间内,当证据平均对应更高的可靠性时,先验知识将被合并为相对于固定数量的累积证据的较小偏差信号。在经过的决策时间较长时,当证据平均对应于较低的可靠性时,先验知识将作为相对于相同数量的累积感官证据的较大偏置信号被合并。由于累积证据和概率之间的关系随时间而变化,这将允许先验知识的影响在概率方面保持不变。我们的研究表明,当在方向辨别任务中加权先验概率时,大脑会考虑到这一规律。

材料和方法

行为任务。

两名人类(一名女性,一名男性)和四名恒河猴(两名女性,两名男性)受试者接受了运动辨别任务的训练。在每次实验期间,使用下巴托和前额杆稳定人类受试者的头部;猴子们也用了一个头柱来达到同样的目的。使用Matlab的心理物理工具箱在计算机显示器上显示刺激(75 Hz帧频)(布雷纳德,1997年). 使用EyeLink红外视频跟踪系统(采样率,250 Hz)监测人类和使用巩膜搜索线圈(1 kHz)监测猴子的眼睛位置。试验开始时,受试者需要注视一个点。在可变延迟后(猴子至少500ms),两个亮红色选择目标出现在距离固定点相等且相隔180°的位置。在可变延迟后,随机点运动刺激出现在直径为5-10°的光圈中,该光圈以固定点为中心,或沿与所选目标形成的轴正交的方向,最大偏心10°。运动刺激由一组随机定位的点组成,这些点在一个视频帧中显示,然后在40毫秒后更新(例如,第1帧中的点在第4帧中更新;第2帧中的点在第5帧中更新,依此类推)。为了进行更新,每个点可能会偏移14.4 min弧(即6.0°/s)C类称为运动相干(coh),或在随机位置替换。网点密度为16.7点·度−2·秒−1.

在每次试验中,有两个可能的运动方向,相差180°,与选择目标形成的方向轴相对应。从一组中随机选择运动强度(相干运动点的百分比),C类∈ {0, 3.2, 6.4, 12.8, 25.6, 51.2}. 对于其中一名受试者,使用了另一组,C类∈ {1.6, 3.2, 6.4, 12.8, 25.6, 51.2}. 受试者的任务是确定相干运动的方向,通过扫视适当的选择目标(例如,向右运动的是右目标,向左运动的是左目标)来指示。受试者可以在运动开始后的任何时候做出决定。受试者收到了所有正确选择的积极反馈,以及在没有净运动(0%一致性)的情况下,根据先前概率(见下文)确定的随机百分比。猴子的正反馈是一种液体奖励;对人类来说,这是一种道德提升的听觉音调。

在不同的试验块中,我们改变了运动方向的先验概率。在中性先验概率块中,两个运动方向的每一个都以50%的概率显示。在不等先验概率块中,一个方向的概率为80%,另一个方向为20%。根据在不等先验块中的约定,我们定义正运动相干为高概率方向,负运动相干为低概率方向。在中性先验块中,正值被定义为对应于向右方向。在一只猴子的一小部分神经元中,我们使用了一对中间前体(67%和33%;四个细胞占67%,五个细胞占33%)。我们观察到了中间效应,这与从更大数据集中得出的结论一致。这些数据不包括在分析中。

对于人类,我们提供了口头指示,详细说明了先验概率。在不同的会话中收集具有不同先验概率的块。由于我们无法为猴子提供有用的口头指示,我们制定了一个程序来帮助它们识别先前概率的变化。训练总是从一个中立的先验概率块开始,该块由200-400次试验组成。接下来,我们提出了一组先验概率不等的试验。选择先验是为了支持猴子在先前中性先验块中较少选择的方向;这些偏差通常较小(平均相当于-1.7±0.2%coh)。不相等的先验信息块由20个线索试验发出信号,这些线索试验包括向较高先验方向的100%相干运动。在这些线索试验之后,在新的条件下进行了300-600次试验,或者直到猴子无法完成任务或失去足够的神经隔离而不得不停止训练。最后,在一些实验中,显示了第三个试验块,其先验概率倾向于相反的运动方向。这个街区也有如上所述的线索试验信号。即使使用这种结构化技术,猴子通常也不会立即调整他们的偏见。应用于±30个试验的移动窗口的Logistic回归表明,第一次改变需要~200个试验才能达到稳定,第二次改变需要约300个试验,因此我们只分析了这些调整期后的试验。

这些猴子接受了训练,以达到类似的、稳定的速度-准确性机制,适合神经记录。我们采用奖惩相结合的方法来对抗猴子的自然反应倾向,即反应迟缓。为了最小化预期,从截短的指数分布(范围为500–3000 ms;平均值为1200 ms)中提取的随机区间将选择目标的呈现与随机点运动分开。对所有猴子来说,标准的试验间隔都增加了超时惩罚。该惩罚被分级为惩罚速度更快的错误(持续时间范围为400–4000 ms)。对一只猴子来说,奖励被有条件地延迟,因此,尽管奖励总是针对正确的选择,但在运动开始后不到1000毫秒就提供了奖励。对于另一只猴子,在一些训练课程中,调整奖励大小,以鼓励在简单和困难的试验中快速和慢速反应时间(RT)。该协议仅用于训练的一个子集,在记录行为或生理数据时未使用。对于大多数数据表示,所有猴子的行为都是结合在一起的;在每个个体中都发现了类似的结果。

人类受试者接受了两种不同的速度-精度训练。这是通过口头指示和广泛实践实现的。首先,对人类进行训练,使其以单一速度执行任务,即两个运动方向的准确度设定点保持中立,直到他们达到一个稳定的心理测量阈值,并且RTs在多次训练中保持稳定(每个受试者至少六次训练)。在切换中立型先验者的速度-准确性模式时,受试者被告知通过更快或更慢的反应在不同的速度模式下操作。我们在逐期基础上监测RTs,以评估新政权的稳定性,需要至少两次调整。给定速度下的不平等先期训练——对于相同的训练,准确率训练总是遵循中立先期训练。对于不平等的前几节课,受试者被指示保持他们的一般速度制度;他们没有得到关于特定目标RT的额外指示。受试者对正在测试的理论及其预测很幼稚。

所有的训练、手术和实验程序都符合美国国立卫生研究院实验动物护理和使用指南并获得华盛顿大学动物护理委员会或人类学科委员会的批准。

行为分析。

行为数据采用有界累积模型进行拟合。该模型的工作原理是将瞬时证据累积到上限(+A类)或下限(−A类),对应于两个方向选择。我们将累积的证据称为该模型中的决策变量。积极证据支持一种选择,消极证据支持另一种选择。如上所述,当先验值不相等时,我们将正方向定义为具有较高先验概率的方向。每个时间步长中收集的瞬时证据来自高斯分布,单位方差为1s,平均值μ由运动强度的线性变换确定:μ=千立方厘米,其中C类是运动强度,以及k个是适当缩放运动强度的自由参数。这种关系是合理的,因为已知中颞区(MT;也称为V5区)方向选择性神经元之间的预期放电率差异平均而言呈线性变化,这是运动强度的函数(Britten等人,1993年). 该模型的瞬时证据和决策变量都与神经反应有关(Mazurek等人,2003年;Shadlen等人,2006年). 累积证据最先达到的界限决定了选择,而决定时间则取决于达到该界限所需的时间。RT是该决策时间与附加刺激无关的非决策时间的组合,t吨此基本模型具有三个自由参数(k个,A类、和t吨)必须修改以解释先验概率对选择和RT的影响(策略2和3,如下)。

我们使用三种策略来分析先验概率对行为的影响。第一种是逻辑回归,它提供了选择偏差大小的描述性(即无神论)度量:

方程式图像

哪里P(P)+是受试者选择先前偏好的方向的概率,C类是运动强度(根据上述惯例,带有指示运动方向的符号),以及是一个指示符变量(先验不相等的块为1,否则为0)。β是拟合系数。β0代表中性先验下的行为偏差,在这些实验中可以忽略不计,β1表示运动对“正向”选择对数概率的影响,以及β2量化归因于先前的偏见。将先前诱导的偏差表示为运动强度β的等效变化是很方便的21零假设的统计检验(无先验影响)仅基于β2{H(H)02= 0}.

第二种策略是通过允许DV起点偏移来改变有界累积模型的参数。这实际上实现了静态偏置信号。它引入了一个额外的自由参数(V(V)0)除上述三种外,对于有界累积模型。

第三种策略实例化了我们关于依赖时间的偏置信号λ的理论(t吨),这取决于受试者在给定经过的决策时间内的准确性。这属于具有动态偏置信号(DBS)的一类模型。除非另有说明,否则我们使用DBS表示λ的特定公式(t吨),根据我们的理论推导如下。我们首先从中立的先验条件中计算出一个时间依赖性准确度(TDA)函数,它只是受试者的准确度作为整个刺激集合中经过的决策时间的函数,即:,P(P)c(c)(t吨). TDA函数的细粒度估计直接从与中性先验数据拟合的有界累积模型中获得。

接下来,我们假设决策变量的值之间的映射V(V)(t吨)在界限处(±A类)以及正确选择的对数后验概率(LPO)作为终止过程的函数t吨,这只是TDA函数当时的对数几率。因为我们考虑了对数空间中的映射,所以它简化了概率的组合。在这种思想下,先验概率的对数几率只是与当时DV表示的LPO相加。该实现依赖于这样一个近似值,即任何特定时间的LPO都是当时DV的线性函数。事实上,这种关系是非线性的,但近似值是合理的。它简化了先验值表示为绑定高度的一部分。在这种实现下,通过给定经过的决策时间内与界限相对应的LPO的分数,先验函数有效地将DV推近正界限(根据我们的符号约定)。因此,动态偏置信号如下:

方程式图像

哪里P(P)是运动在一个方向上的先验概率(按照惯例,我们称之为正方向)。该表达式包含一个额外的参数,用于衡量先验概率,P(P),以解释主体错误估计先验值的可能性。

注意,的分子中的对数项方程式2是一个常量。这是有意义的,因为先验值在决策持续时间内是固定的,实际上是在数百个决策块的持续时间内。然而,“偏置信号”λ(t吨)随着时间单调增加,因为正确选择的LPO随着决策时间的延长而减少。对于这种关系的性质,一个直观的理由来自三个考虑因素。(1) 瞬时证据的每个样本与在两个可能方向下提取该样本的似然比(LLR)的对数成正比(Gold and Shadlen,2001年). (2) 对于固定的运动强度,样本和LLR之间的比例常数也是固定的。这第二个考虑意味着,在中性先验下,束缚高度对应于LPO,即在任何时候对任何一种运动强度作出正确选择。因此,平界意味着LPO是随时间变化的常数。(3) 做出正确选择的LPO随运动强度而变化。逻辑心理测量功能清楚地说明了这一点。如果精度随运动强度变化,则LPO也会随之变化。总之,这三个因素意味着相同的界限代表了每个相干的不同LPO(Link,1992年;Shadlen等人,2006年). 然而,每个停止时间都与不同的相干混合相关联。特别是,较长的停止时间与较大比例的低相干刺激相关。因此,如果该决定尚未终止,则证据越来越不可靠。λ的上述方程式(t吨)精确地导出,以在确定针对给定先验概率添加到DV的偏置信号时将该关系考虑在内。

决策变量传播的完整计算,V(V)(t吨),可用以下方程式表示:

方程式图像

方程式图像

方程式3是描述漂移扩散的随机微分方程:C类是运动强度,k个是拟合的漂移系数,以及W公司是标准的维纳过程。方程式4将DV作为漂移扩散的总和等式3,受θ(0)=0]和动态偏置信号的影响(等式2). 当DV达到其中一个判定界限时,该过程终止,±A类(t吨). 注意,对于标准模型,决策边界是恒定的;它们只会随着时间的推移而变化,以备下文所述的紧急情况下使用。

我们仅使用四个自由度将来自中性和不相等先验条件的选择和RT数据与我们的DBS模型进行拟合(k个,A类,t吨,和)。这些参数同时适用于完整的数据集。我们使用福克-普朗克方程的数值解计算了DV每次跨越上下限的概率(Chang和Cooper,1970年;Press等人,1988年;Kiani和Shadlen,2009年). 所有拟合均采用选择和平均RT的最大似然法。我们将模型拟合与使用替代的“静态偏置信号”模型获得的拟合进行了比较,其中λ(t吨)被替换为一个到某个决策边界的静态偏移量。这个模型还有四个自由度(k个,A类,t吨和偏移量V(V)0). 请注意,此参数化等效于具有两个独立边界的模型。DBS和静态偏置信号模型之间的比较基于贝叶斯信息准则(BIC),−2∧+k个日志(n个),其中∧是模型的最大对数似然,k个是自由参数的数量,以及n个是数据点的数量。最后一项是惩罚额外自由参数的修正,因此在比较具有相同自由参数数的模型时,它是不变的。比较两种模型时,BIC标准较低的模型更可取。BIC中0.5的差值近似于贝叶斯因子的对数,即一个模型优于另一个模型的可能性(卡斯和拉弗瑞,1995年). 贝叶斯因子大于10表示支持模型的有力证据,大于100的值被视为决定性的(杰弗里斯,1961年). 在比较模型时,我们报告了近似贝叶斯因子。对于所有执行的比较,该值对应于应被视为决定性的贝叶斯因子。

当我们改变速度-精度制度时(参见图5),我们建立了一个新的参数估计A类在新体制下,我们的DBS模型处于中立状态。重要的是,我们只拟合中性先验数据与这个单一参数的变化。我们使用这些数据的TDA函数推导λ′(t吨)在这个新政权中。然后,将所有其他参数保持在其原始值,我们预测了不相等先验下的选择和RT。通过这种方式,在新的速度-精度范围内的不相等先验数据没有以任何方式用于确定模型的自由参数值。这些预测由中的虚线曲线显示图5。结果中报告的方差分数(2)将预测曲线与平均RT和选择频率进行比较。

保存图片、插图等的外部文件。对象名称为zns9991198990005.jpg

DBS模型解释了先验概率在不同速度-精度范围内的影响。符号显示了两名受试者(2400和3125次试验)在更快速度下观察到的选择比例和平均RT。来自具有中性和不相等先验的块的数据分别由填充符号和开放符号表示。打印约定与图2实心曲线是对中性先验概率条件下的数据进行模型拟合。除决策界限外的所有参数都固定为用于拟合高精度范围内数据的值。所以,在配合中只有一个自由度。虚线是不等先验条件下的预测选择和精度函数(数据由开放符号表示)。这些理论预测是从DBS模型中获得的,其参数是通过拟合高精度区域的数据和快速区域的中性先验数据而建立的。有关详细信息,请参阅结果。

替代静态偏置信号模型没有给出改变速度-精度设定点时偏移量的改变量。因此,为了检验它在新的速度-精度范围内解释数据的能力,我们进行了一次全新的拟合。为了衡量这种拟合的质量,我们还使用我们的DBS模型对新的速度-精度体系中的数据进行了新的拟合(而不是上一段中描述的基于预测的方法)。这提供了一个公平的比较,因为这两个模型在每个速度-精度范围内都允许四个自由度。

我们进一步测试了我们观察到的行为模式是否可以用一个静态偏置信号模型和一个非偏置时间依赖的束缚坍塌来解释。对称边界崩塌可能会发出“紧急”信号,作为决定的软期限(Churchland等人,2008年;Cisek等人,2009年). 时间相关的束缚坍缩被建模为双曲线函数,因此束缚的大小(在添加偏置信号之前)由以下方程描述:|A类(t吨)| =u个 t吨t吨+τ1/2其他参数化也可能有效,但这种特殊选择对于猴子执行动作辨别任务来说是合理的(Churchland等人,2008年). 由于边界崩溃以对称的方式使两个边界都接近于零,因此单靠它无法解释先验概率对选择和RT的非对称影响。然而,我们想测试这样的细化是否可以改进静态偏差信号模型与我们的DBS模型相比的行为数据的拟合度。如上所述,我们使用BIC将具有折叠边界的DBS模型与具有折叠边界的静态偏置信号模型进行了比较。

神经记录。

在两只恒河猴进行反应时间-运动辨别任务时,在顶叶外侧区(LIP)记录到52个神经元。这是四只接受过行为训练的猴子中的两只。我们使用标准方法记录单个神经元的动作电位(Roitman和Shadlen,2002年). 根据解剖学和生理学标准选择神经元。立体定位坐标结合结构磁共振成像(MRI)扫描用于识别LIP并指导记录电极的放置。我们相信本研究中记录的大多数神经元位于LIP的腹侧(刘易斯和范·埃森,2000年). 该评估基于(1)将记录位置注册到每只猴子的MRI,并与标准平面图进行比较[插入符号软件(Van Essen等人,2001年)]相邻区域的响应特性。

一旦确定了正确的解剖位置,如果神经元在记忆引导的扫视中表现出空间选择性的持续活动,则选择神经元(Hikosaka和Wurtz,1983年;格纳特和安徒生,1988年). 在这项筛选任务中,猴子固定一个中央注视点,而目标在外围短暂闪烁(200毫秒),然后熄灭。随后是500–2000毫秒的延迟,在此期间猴子需要记住闪烁目标的位置。延迟后,注视点熄灭,猴子需要扫视到闪光目标位置的3°以内。通过在不同的实验中改变目标的位置,我们确定了在记忆期间引起神经元最大反应的空间位置;这种空间位置称为响应场(RF)。一旦确定了射频,我们就对记忆扫视任务进行了反复试验,其中目标被放置在两个位置之一,一个在射频内,另一个在RF外。如果记忆期内的平均尖峰率显著高于(第页<0.05,双尾t吨试验)用于内部RF试验,而非外部RF试验。

在整个记录过程中,使用两项任务重新评估了神经元的稳定性和选择性:记忆扫视任务和视觉扫视任务,这两项任务与记忆扫视相同,只是目标在整个试验过程中保持发光状态。视觉或记忆扫视试验与运动辨别任务试验随机交叉进行。如果一个神经元似乎改变了或失去了它的空间选择性或记忆活动,实验就中止了。

神经分析。

刺激周时间直方图(PSTH)是通过使用10毫秒箱组合所有细胞的反应生成的。PSTH与两种不同的事件相一致:运动开始和扫视开始。当与运动开始对齐时,排除扫视开始100 ms内的时间段,以避免平均值与扫视周活动相污染。同样,当与扫视对齐时,排除运动开始后210 ms内的时间段,以避免运动开始后的放电率下降造成污染。试验按运动方向和强度分组,强运动占51.2%,中等运动占6.4、12.8和25.6%,弱运动占0和3.2%。对于生理分析,T在里面运动是指与被记录单元射频中目标相关的方向。T型外面的运动是指相反的方向。

为了测量神经记录中的偏差信号,我们比较了中性和不相等先验块上的响应。对于所有神经元,在中性先验概率条件下收集数据。然而,对于许多神经元来说,数据是在两种可能的不相等先验概率条件中的一种条件下收集的:在里面或之前偏爱的T外面的我们估计了神经偏差信号的静态和动态分量。静态分量是偏置信号中不依赖于经过的判定时间的部分。为了分析这一点,我们检查了LIP反应的平均偏移是否发生了变化,即运动整合开始时的活动水平与决策形成结束时的反应聚合水平之间的差异。这一差异是直接根据T的运动开始后~200 ms和扫视开始前~60 ms的平均放电率估算的在里面选择。这些时间对应于该数据集这些过程的神经特征(参见图6)与之前的研究一致(Roitman和Shadlen,2002年;Huk和Shadlen,2005年;Churchland等人,2008年).

保存图片、插图等的外部文件。对象名称为zns9991198990006.jpg

LIP中决策变量的神经相关性。LIP神经元的平均放电率显示为中性点决策期间时间的函数()和不平等(b条,c(c))先验。在中性和一个或两个不相等的先验条件下记录每个神经元。选择目标之一(T在里面)在神经元的反应场中,相干运动的方向要么支持这种选择,要么支持相反的选择(T外面的). 在图的左侧,响应平均值与随机点运动的开始对齐。在图的右侧,反应平均值与扫视开始时间一致。试验按运动强度(颜色)和方向(实心和虚线表示向T方向运动在里面和T外面的(分别是),只有正确的选择才有助于这些平均值。响应平均值以10 ms为单位进行计算。对于所有情况,运动证据(强度和方向)影响从运动开始后~210 ms到扫视开始前~60 ms的平均反应。这定义了在LIP发射率中反映决策形成的时代。,空档前挡块。b条,先验概率有利于选择T作为奖励的方向在里面(之前80:20)。c(c),先验概率有利于选择T作为奖励的方向外面的(20:80之前)。

我们使用了三种方法来分析神经偏差信号的动态成分,它对应于依赖于经过的决策时间的部分。这三种方法都是基于对先验概率对神经反应累积率影响的估计,并且都是从逐个试验的累积率估计开始的。通过单独估算每次试验的累积率,我们能够避免在根据多次试验的平均值估算发射率时出现的“消耗”伪影。由于即使在相同的运动强度和先验条件下,RT也分布广泛,因此这些平均值包括不同时间的不同试验。例如,随着时间的推移和一些试验的完成,这些试验与平均值的损耗往往会使平均速率偏向较低的值。我们的单次试验方法通过从单个反应中形成累积率的估计值,然后对其进行平均,从而避免了这种偏差。

在每次试验中,我们通过将尖峰序列与α样函数卷积来估计放电率函数:(1−e(电子)(−吨/克))e(电子)(−吨/天),其中d日=20 ms和=1 ms。我们通过将线性回归应用于这些平滑速率函数,在运动开始后200 ms到T眼跳开始前60 ms的时间段内,提取了每次试验的累积速率估计值外面的T的选择和扫视开始前100毫秒在里面选择。这个时间段是根据决策形成的时代来选择的,其中LIP反映了运动证据的整合(连贯性和方向性)。我们的数据将此纪元的结束时间定在扫视开始前约60毫秒,与之前的研究一致(Roitman和Shadlen,2002年;Huk和Shadlen,2005年;Churchland等人,2008年). 然而,为了减轻人们对将可能定型的扫视周爆发的任何部分包括在重建率估计中的担忧,我们排除了扫视前100毫秒的T波在里面选择。

第一个分析是对假设在不相等的先验下存在动态偏置信号的简单测试,没有规定其确切形式。对于每个神经元,我们计算了每个运动强度、方向和先验概率条件的平均累积率。为了分析先验概率对累积率的影响,我们比较了每个运动强度和方向在细胞群中的平均值(参见图7,b条). 当比较中性点和每个不相等的先验条件时,我们只包括在相应的不相等先验条件中收集数据的单元格(n个=37个中性神经元,与之前的偏好T相比在里面;n个=38个神经元,与之前的T相比外面的). 此外,要求每个细胞在特定条件下(即运动方向和强度)进行至少五次试验,以纳入该条件的平均值。根据这一要求,没有任何单元格被完全排除在外。使用双向方差分析(ANOVA)评估了关于连贯性和先验对累积率影响的统计假设,连贯性和前验是两个因素。我们还包括一个相互作用项,以确定前驱物对堆积速率的影响是否取决于运动强度。下面,我们描述对全神经源性偏差信号的更严格的统计分析。

保存图片、插图等的外部文件。对象名称为zns9991198990007.jpg

当先验概率不相等时,LIP响应呈现动态偏差信号。运动强度和先验概率对T的影响在里面堆积速率。累积速率是发射速率与时间函数的斜率,与运动积分开始对应的时间相对应(参见材料和方法)。正运动强度对应于T中的运动在里面优先选择的方向(即朝向)。对于每个神经元,计算每个运动强度、方向和先决条件下的累积速率。这两个区块中测试的神经元总数的平均值为±SE(n个=37个神经元)。黑色和红色符号分别表示中性和80:20之前。前者导致堆积速率增加,主要是因为运动强度减弱。b条运动强度和先验概率对T的影响外面的关于堆积速率。正运动强度对应于前一方向上的运动(即朝向T外面的). 与中的相同约定(n个=两个区块中研究的38个神经元)。前者导致堆积率降低,主要是因为运动强度减弱。最强的相干性(51.2%)未显示在b条; 在这种运动强度下,前驱对堆积速率没有可靠的影响。c(c),d日,先验概率对累积率的时间依赖性影响。本分析仅使用0%相干运动的试验。在滑动时间窗口(宽度为150 ms;横坐标上的时间表示窗口中点)中估计累积速率。中性先验和不相等先验的累积速率差异显示为时间的函数(窗口起点相隔25ms)。图形从运动依赖性增强的开始开始,当平均值中剩下的试验不到一半时,图形停止。c(c),当优先选择T在里面与中性先期相比,随着时间的推移,累积速率有所增加。d日,当先前偏好的T外面的与中性先期相比,随着时间的推移,累积速率有所下降。e(电子),(f),偏置信号的神经推导估计。这是基于先验对每个运动强度累积速率影响的加权平均值,如b条每种运动强度的权重基于尚未终止的试验百分比,作为时间的函数。该分段变化率函数的积分提供了神经偏差信号动态分量的估计。神经衍生偏差信号(实心曲线)是该动态分量和根据LIP偏移变化估计的静态分量的总和(见材料和方法)。细长的灰色线显示了一个线性偏置信号,该信号是根据先验对每个运动强度的累积速率的影响的未加权平均值推断出来的。虚线显示神经衍生偏差信号(引导)上95%CI的边界。e(电子),当优先选择T在里面,估计的偏差信号是正的,并且随着时间的增加而增加。(f),当优先选择T外面的,估计的偏差信号为负值且呈下降趋势。

其余两个分析实现了对含时偏置信号一阶导数的分段线性近似。第一种方法借鉴了上段所述的分析。特别是,我们从单个试验中估算了斜率,但我们将其限制在150 ms滑动窗口内。对于包含该特定时间点的完整滑动窗口的所有试验,每25ms估计一次斜率。在本分析中,我们使用0%相干运动条件,因为它提供了最长的RT。其他运动强度也观察到了类似的趋势。我们计算了相同时间点中性试验和不相等试验之间以这种方式测得的平均斜率差异(参见图7c(c),d日). 这种差异提供了神经偏差信号变化率的分段近似值。

第二种方法基于为每个运动强度计算的累积率(参见图7,b条). 因为不同的运动强度与不同的RT相关联,所以我们可以将其用作估计神经偏置信号的时间依赖性的杠杆。对于每种运动强度,我们仅使用在两种条件下记录的神经元,计算了中性和不相等先验条件下平均累积速率的差异。这是分别针对有利于T的不平等优先权进行的在里面选择和有利于T的不平等先验外面的选择。每个运动强度的先验值导致的累积速率差异可视为与该运动强度相关的RT的偏置信号变化率的线性近似值。为了在决策形成期间的每个时间组合这些线性近似值,我们基于每个运动强度在当时尚未终止的试验的百分比计算了加权平均值。这提供了神经偏置信号变化率的近似值。此变化率的积分将其转换为偏置信号本身的动态分量的估计值,以尖峰速率为单位。添加上述静态分量可以得到全偏置信号的神经推导估计值(参见图7e(电子),(f)).

我们使用非参数自举分析测试了该偏差信号的统计显著性。我们通过与上述相同的计算方法来确定神经源性偏倚信号的采样分布,同时在中性和不相等的先验条件下用替换的方法重新采样。选择重采样试验的数量与非自举分析中每个条件下使用的试验数量相匹配。该程序重复1000次,以生成抽样分布的估计值。然后,我们可以通过检查bootstrap方法确定的95%置信区间(CI)来测试偏差信号是否显著。我们使用相同的分析来确认,当控制受试者选择的可能混淆时,神经衍生的偏差信号仍然显著。为此,我们从T在里面和T外面的分别进行选择,并将每个偏差信号的估计值进行组合。使用相同的引导程序,我们发现这个信号也很重要。

我们还研究了运动开始前200毫秒内先验概率对神经反应的影响。除了确定对平均放电率的影响外,我们还测试了这个时期的反应变化是否与决策形成开始时(运动开始后约200 ms)的反应在逐个试验的基础上相关。对于每个神经元,我们标准化了分析时段中每个先验概率条件的响应。然后,我们使用皮尔逊相关系数测试了两个时代之间的标准化响应是否相关。

根据神经衍生的偏差信号预测行为变化(参见图8b条),我们使用了k个,A类、和t吨有界累积模型的参数与中性先验下获得的行为数据相吻合。然而,代替使用该模型的动态偏置信号[λ(t吨)],我们替换了神经衍生的偏置信号。如上所述,该信号由神经偏置信号的静态分量(即LIP偏移的测量变化)和神经偏置信号(源自每个运动强度的累积速率变化)的动态分量组成。因为我们对高低不等的先验条件都有一个估计偏差信号,所以我们平均了这些信号的大小(即绝对值)以进行行为预测。为了将此映射到模型,我们将神经衍生的偏差信号表示为束缚高度的百分比变化。这是使用估计的神经偏差信号与中性先验条件下测得的LIP偏移的比率来计算的。测得的LIP偏移是决策过程开始和结束时的有效射速差,即神经界。

保存图片、插图等的外部文件。对象名称为zns9991198990008.jpg

神经衍生的偏差信号预测了不相等先验的影响。神经衍生偏差信号与DBS模型预测的偏差信号的比较。这两个信号均绘制为绑定高度的分数。这些信号的大小相当,但在形状上有所不同。b条预测的选择和RT函数来自神经衍生的偏差信号。这些符号显示了猴子的相同选择比例和RT,如图2(同样的惯例)。实迹是有界累积模型与中性先验概率条件下获得的数据的拟合。通过在有界累积框架中用神经衍生的偏差信号代替模型衍生的偏差信息,对不相等的先验概率条件进行行为预测(见材料和方法)。这些预测通过虚线曲线显示。

我们使用逻辑回归来测试动态偏差信号的神经特征与猴子的选择之间可能存在的逐次试验关联。逻辑模型如下:

方程式图像

哪里P(P)+是T的概率在里面选择,C类是有符号的运动强度,L(左)是先前赔率的对数[sgn(L(左))是其符号:−1、0或+1],并且z(z)项是根据决策形成开始时的峰值速度计算的神经响应的转换(z(z)0)和决策形成期间的累积率(z(z)日分). 由于堆积速率受运动强度的影响,我们计算了其z(z)-除了在小区内和先前概率条件之外,在有符号的运动强度条件内得分。β是拟合系数(最大似然)。方程式5允许测试神经参数是否变化(z(z))在解释变量存在的情况下对选择产生影响(C类L(左)). 我们还执行了一个扩展版本的回归,其中包括一个额外的z(z)-基于运动开始前200ms历元中的发射率的得分项。

结果

我们训练了两个人和四只猴子(猕猴)执行双向选择辨别任务的反应时间版本(图1). 任务难度是通过控制连贯移动点的百分比来控制的。由于一系列运动强度随机交错,受试者对每次试验中获得的证据的可靠性缺乏了解。要求受试者确定相干运动的净方向,并通过对相应目标进行眼球运动来指示选择。运动刺激在扫视开始之前一直可见。我们操纵了试验块中运动方向的先验概率(范围为每块200–1000次试验)。

保存图片、插图等的外部文件。对象名称为zns9991198990001.jpg

任务设计。受试者在动态随机点显示中区分两个可能的运动方向。受试者可以在随机点运动开始后的任何时间对其中一个选择的目标进行扫视眼动。从运动开始到扫视开始所经过的时间就是反应时间。相干运动的随机点的比例决定了运动强度,因此也决定了方向判定证据的可靠性。这对于给定的试验是固定的,但在不同的试验中从一组跨越一系列困难的运动强度中随机抽取。在不同的试验块中,运动方向的先验概率为中性(50:50)或偏向其中一个方向(80:20)。在猴子的神经记录中,一个选择的靶点被放置在单个LIP神经元的反应场中,另一个靶点被放在相反的半场中。

我们首先描述先验概率对受试者行为的影响。模型适用于受试者的选择,RTs支持先验概率的影响取决于决策形成过程中经过的时间这一理论。然后,我们对该理论的预测进行了两个额外的测试。首先,先验概率的影响取决于受试者应用的速度-准确性机制。第二,先验概率对参与决策的神经元的影响取决于决策形成过程中经过的时间。我们通过改变受试者的速度-准确性权衡来测试他们的第一个预测。我们通过测量LIP区的神经活动来测试恒河猴的第二个预测,之前显示LIP区代表扫视任务的先验概率(Platt和Glimcher,1999年)并代表DV执行动作识别任务(Shadlen和Newsome,2001年;Roitman和Shadlen,2002年;Hanks等人,2006年;Gold and Shadlen,2007年;Kiani和Shadlen,2009年;Rorie等人,2010年).

先验概率的行为效应

对于所有受试者,在所有条件下,刺激运动的强度和方向决定了选择和反应时的模式。在这里和整个过程中,我们将运动强度表示为连贯运动点的百分比,并使用符号表示方向。当两个运动方向的先验概率相等时,较强的正向运动导致较高比例的积极选择,而较强的负向运动导致较低比例的积极选项(图2,填充符号)。两个方向上更强的运动也会导致更快的RT(图2,填充符号)。这些观察结果与之前在猴子和人类受试者身上使用该任务的研究一致(Roitman和Shadlen,2002年;Palmer等人,2005年;Cohen和Newsome,2009年).

保存图片、插图等的外部文件。对象名称为zns9991198990002.jpg

DBS模型解释了运动方向的先验概率改变时的选择和RT。顶行显示了运动强度和先验概率对选择的影响。积极选择的比例被绘制为运动强度的函数。运动强度的符号表示方向。对于先验不相等的块,正方向是80:20或20:80先验所青睐的方向(参见材料和方法)。填充符号和开放符号分别描述中性和不相等先决条件的选择比例。底部一行显示了运动强度和先验概率对平均反应时间的影响。填充符号和开放符号遵循与选择函数相同的约定。误差条为SEM;许多都比符号小。对于所有的选择函数和RT函数,实线和虚线显示DBS模型分别适合中性和不相等先验条件下的数据。左两列显示了来自个体人类受试者的数据(分别为2400项和2785项试验)。右栏显示了四只恒河猴的汇总数据(36687次试验)。

当先验概率倾向于一个方向而非另一个方向时,选择和RT函数发生了变化(图2,打开符号)。按照惯例,我们将正向运动定义为优先方向。因此,在给定的刺激强度下,受试者会做出更多与正向运动相对应的选择。此外,这些选择的RT降低,而与负运动方向相对应的选择的RT增加。

我们应用有界证据积累模型来理解选择模式和RT(图3). 这个框架解释了人类和猴子的大量心理物理实验(拉明,1968年;Link,1992年;Ratcliff和Rouder,1998年;Gold and Shadlen,2002年;Ratcliff和Smith,2004年;Palmer等人,2005年;Bogacz等人,2006年;Kiani等人,2008年). 在该模型中,随着时间的推移,噪声感官证据被积累到DV中,DV随着漂移而扩散,直到达到终止过程并确定选择的上限或下限。漂移率与运动强度成正比,从而使扩散偏向正或负边界。在这里考虑的最简单形式中,该模型只涉及三个参数(参见材料和方法)。当先验概率为中性时,即两个运动方向的概率相等时,这个简单的模型解释了选择和平均RT(图2,实心曲线),与之前的研究一致(Mazurek等人,2003年;Palmer等人,2005年).

保存图片、插图等的外部文件。对象名称为zns9991198990003.jpg

证据有限积累模型。其中一个备选方案的瞬时证据和另一个的瞬时证据以单位方差高斯分布,平均值与运动强度成正比。这一瞬间的证据是随着时间的推移而积累起来的。累积的证据称为决策变量,类似于随机游走或漂移扩散过程。我们已经为该示意图显示了DV的平滑版本。当DV分别达到上限或下限时,该过程以正选择或负选择结束+A类或−A类在运动辨别任务中,我们认为瞬时证据主要表现在MT和其他运动选择区域,而LIP则表现为形成DV的累积证据。,中性优先。DV开始于边界的中间,DV仅受到瞬时证据的影响,这会导致与运动一致性成比例的漂移。b条,不平等的先验。先验概率增加了DV的额外偏差。这个附加的偏置信号未知。在这里,它被描述为决策时间的递增函数。在本例中,它会导致提前作出正向决策。

当先验概率倾向于一个方向时,这种知识如何影响决策过程?如中打开的符号所示图2,它导致RT和choice函数发生变化。我们的目标是了解为什么观察到的变化具有特定的幅度,以及RT和选择函数中的变化模式告诉我们有关该机制的信息。特别是,我们的目标是识别添加到DV中的信号,以引起这种行为偏差。为了发展我们的论点,我们需要分享一种直觉,即为什么添加到DV中的偏差信号可能会随着决策时间的变化而变化,尽管先验概率在整个决策过程中是固定的,实际上,在整个试验过程中也是如此。

偏差的动态模型是基于这样一个事实:在中性先验下,准确性随着所呈现的刺激集合的决策时间而降低(图4,b条). 这是与更困难的试验相关的较长RT的直接结果。从选择和RT函数可以看出,较弱的刺激产生较低的准确性,也会导致平均RT较长。因为这一完整的关系称为时间依赖性准确度(TDA)函数,它描述了准确度如何随着决策时间的变化而变化,所以它将决策过程中经过的时间与收集到该点的感官证据的平均可靠性联系起来。当选择承诺的DV标准或界限在较弱和较强刺激之间保持不变时,准确性的差异意味着对于相同大小的DV,证据的可靠性水平不同。特别是,它表明,相同大小的DV平均对应于更短的决策时间内更高水平的证据可靠性,以及更长的决策时间后更低水平的证据可靠度(Kiani和Shadlen,2009年). 为了利用这种时间结构,受试者可以将先验概率作为一个动态偏差信号加入决策过程中,该偏差信号取决于TDA函数(图3b条).

保存图片、插图等的外部文件。对象名称为zns9991198990004.jpg

TDA功能。将正确选择的概率绘制为中性先验条件下反应时间的函数。图表来自两名受试者,他们在两种不同的速度-精度范围内进行了测试。实线和虚线轨迹分别显示了更高的精度和更快的速度范围。更快的速度导致在所有决策时间的准确性降低,并且TDA函数的形状发生变化。

我们将动态偏差信号计算为先验概率与正确选择概率的概率组合。TDA函数在给定的决策时间内暗示了这些概率。先验值为DV添加一个值,该值对应于给定决策时间正确选择的对数概率的一小部分(参见材料和方法)。虽然从理论上讲,这本身应该为动态偏置信号提供了一个处方,但我们还引入了一个额外的参数,用于衡量先验概率,以解释受试者未能充分获得或完美结合此知识的可能性。稍后,我们将讨论此参数的使用。我们发现,该模型描述了在操纵先验概率时观察到的行为模式(图2,虚线曲线)。此外,对于两名人类受试者,该模型分配的偏差估计值在实际先验值的85%以内(对于受试者SK和LH,分别等于0.88和0.85);对于所有四只猴子,模型指定的偏差水平在实际先验值的75%以内(平均⌀=0.80±0.01)。

我们还对数据进行了拟合,允许将偏置信号作为一个静态偏移量添加,该偏移量的大小作为一个自由参数。这是将先验概率纳入决策的标准假设(爱德华兹,1965年;林克和希思,1975年;卡彭特和威廉姆斯,1995年;Gold等人,2008年;Ratcliff和McKoon,2008年;Simen等人,2009年). 这种静态偏置信号模型可以直接与我们的DBS模型进行比较,因为这些模型具有相同数量的自由参数(参见材料和方法)。在所有情况下,DBS模型比静态偏差信号模型更适合数据(BIC,贝叶斯因子>108对于人类受试者和>106所有四只猴子;参见材料和方法)。我们将此作为支持大脑利用流逝时间来组合概率表示的观点的证据。

对一些读者来说,使用动态信号来表示平稳先验似乎违反直觉。我们尚未考虑的一种可能性是,将代表先验概率的平稳信号添加到另一个与偏差无关的动态信号中。例如,有人建议,终止界限本身是动态的,对称地塌陷,以缩短信息量较少的试验(Ditterich,2006年). 这样的崩溃界限[相当于在(Churchland等人,2008年)]不会导致选择偏差,但可能会允许静态偏差信号来解释数据。因此,我们将我们的DBS模型与具有静态偏置信号的DBS模型进行了比较。这两个模型都允许有两个额外的自由度,以纳入对称坍塌界限(见材料和方法)。我们发现,当允许界限崩溃时,我们的DBS模型对于人类和猴子来说仍然优于静态偏差信号模型(BIC,Bayes因子>106在所有情况下;参见材料和方法)。

根据这些观察结果,我们得出结论,受试者意识到了先验概率的变化,并且他们通过在决策变量中添加(或减去)时变量将此信息纳入决策。在中立先验下,添加的信号似乎被索引为正确选择的对数概率,作为决策时间的函数。

心理物理测试:速度-准确性的变化

由于我们的DBS模型严重依赖于TDA函数所暗示的证据可靠性和经过的决策时间之间的关系,因此改变这种关系可以对理论进行有力的检验。这是通过指导我们的受试者以更快的速度-准确性执行方向辨别任务来实现的。经过几次使用中性先验的练习后,两名受试者在速度和准确性上都达到了一个新的设定点(图5,填充符号)。与较慢的政权相比,平均而言,决策速度更快,准确性更低。准确性的降低表明,在速度指令下做出的决定是基于积累的证据较少。事实上,速度和准确性之间的这种权衡与决策界限的变化是一致的,决策界限与从较慢的速度-准确性范围中导出的相同模型参数相结合(图5,实心曲线),与之前的研究一致(Reddi等人,2003年;Palmer等人,2005年). 重要的是,在两种速度-精度方案中使用匹配RT的试验与不同的精度水平相关,如中的TDA函数所示图4(均在中立之前)。TDA的变化反映了多种因素的组合:终止决策所需的累积证据水平的变化,以及两种制度中每个RT的不同刺激强度组合。在中立先验下确定的新TDA导致了在决策过程中纳入不平等先验的新规定。

根据我们的假设,经过的决策时间和准确性之间的新关系应该会影响先前信息在决策过程中的动态结合。用于解释高速状态下中性先验数据的决策界限的变化对于这两个选择是对称的,因此它本身不会造成偏见。然而,随着时间的推移,它会导致精确度和DV(即累积证据)之间的映射发生变化。在高速制度下,由于积累的证据在任何时候都不那么可靠,因此先验知识应该对决策施加更多的影响力。当然,前面的内容不会改变。在这个新制度下,支持正确答案的可能性较小的是证据。因此,TDA函数确定了动态偏差信号的形状和大小,应将其作为经过的决策时间的函数添加到累积证据中。这导致在不相等的先验下对选择和RT进行定量预测(图5,虚线曲线)。

观察到的选择模式和两名人类观察员的反应时间支持这些预测。与其他速度-精度方案类似,当先验概率有利于正向运动时,选择和RT函数发生了变化(图5,打开符号)。然而,在高速状态下,优先权对选择的影响更大。这两个受试者的差异在统计学上是可靠的(表1). 对于我们的理论来说,最重要的是,选择比例和RT的变化幅度和模式与理论预测(主题1,2= 0.80; 主题2,2= 0.78). 请注意图5不适合数据(开放符号);相反,预测完全来自于由高精度拟合和与高速状态中性先验数据相关联的边界变化所确定的模型参数。

表1。

测量两名受试者在每种速度-精度范围内的选择行为的行为偏差

主题高精度制度
快速状态
偏见CI公司偏见CI公司
SK公司5.1%同系物3.1–6.3%10.8%同系物9.1–12.6%
左侧4.1%同系物3.1–5.0%8.3%同系物6.9–9.8%

偏倚倾向于与80%的先验概率相关的选择。

虽然我们已经将我们的DBS模型与高精度状态下的静态偏置信号模型进行了比较,但使用高速状态下的数据进行这种比较也很有启发性。值得注意的是,标准静态偏置信号模型并没有提供在不同速度-精度范围内改变偏置偏移量的规定。因此,从一开始,它就没有我们的DBS模型那样的解释力。因此,我们通过允许每个模型在每个模型中的所有四个参数都自由的情况下拟合高速状态的数据来比较模型。这与我们上面描述的高精度数据的分析相同。对于这两个人类受试者,我们的DBS模型比静态偏差信号模型(BIC,Bayes因子>10)更适合数据15; 参见材料和方法)。遵循高精度拟合所描述的类似逻辑,我们还比较了具有对称(无偏)时间依赖边界变化的模型。同样,我们的DBS模型仍然优于静态偏差信号模型(BIC,Bayes因子>1015).

神经元偏置信号的测量

先前在接受过用扫视眼动指示方向决定训练的猴子的LIP中已经证明了DV的神经相关性(Roitman和Shadlen,2002年). 因此,当先验概率偏向其中一个方向而非另一个方向时,我们试图辨别这种神经相关性的变化。我们从上述行为结果描述的两只猴子的52个LIP神经元中进行了记录。

在使用中性先验的试验块上,我们观察到LIP发射率的变化模式与以前的报告类似(图6) (Roitman和Shadlen,2002年;Churchland等人,2008年). 就在运动开始后,活动下降,随后反应上升或下降,这反映了运动的方向和强度以及T的决定在里面或T外面的。这种与决策相关的活动在运动开始后的~200 ms内明显可见。如前所示,这是从刺激运动变化到射频与选择目标重叠的LIP神经元反应变化的潜伏期(Roitman和Shadlen,2002年;Huk和Shadlen,2005年;Kiani等人,2008年). 它比射频中光的简单视觉响应延迟要长得多(Bisley等人,2004年). 我们对伴随着证据积累的神经反应感兴趣,从此时开始,到扫视开始前约60毫秒结束。对于T在里面选择,无论运动强度和RT如何,这个决定终点都以一个共同的射速水平为标志(Roitman和Shadlen,2002年). 这些特征与有界积累机制一致,在使用不相等先验的试验块中也很明显(图6b条).

为了从神经记录中确定偏差信号,我们比较了中性和不相等先验块上的反应。我们寻找了偏差信号的两个方面的证据:(1)从决策开始到结束,射击速度的平均偏移发生了变化;(2)决策形成期间,集结速度发生了变化。请注意,偏移的变化在数学上等同于起点偏移,也等同于偏置信号的静态分量。较高的先验值导致偏移中3.7[95%置信区间,每秒0.1–7.3个峰值(sp/s)]的微小减少,这具有临界显著性(第页< 0.05). 根据在中性先验条件下测得的LIP发射率偏移,这种静态变化相当于该偏移减少了~9%。较低的先验值导致偏移增加较大但不太可靠(5.6 sp/s;95%CI,-1.6至12.8 sp/s;第页= 0.13).

有趣的是,在决定开始时的活动水平似乎在一定程度上取决于运动刺激显示之前的放电率水平。在运动前200 ms的历元中,当优先偏爱T时,放电率为4.6±1.1 sp/s在里面比它偏爱T的时候外面的(第页<0.01),尽管只有后者与中性先兆下的发火率有显著差异(第页<0.01中性既往与既往优势T外面的;第页=0.42(中性优先vs优先考虑T)在里面). 此外,这一时期射击速度的变化与决策形成初期的射击速度在试验与试验的基础上相关联(第页= 0.26;第页< 0.001; 数据未显示;参见材料和方法)。这与之前的研究结果一致,之前的研究表明,当一只猴子在做出决定之前被简单地呈现两个选择目标时,LIP中的先验概率与神经相关(Platt和Glimcher,1999年).

更重要的是,为了确定我们的理论预测的动态偏差信号的神经特征,我们还检查了在这个时代,响应积累的速度是否发生了变化。这是相干性和时间依赖性斜坡活动的斜率图6。累积速率的改变将有效地实现偏置信号的动态分量,因为在试验期间,先验对峰值速率的影响将随着时间的推移而改变。

较高的先验值导致堆积速率增加(图7) (第页<0.01,方差分析)。这意味着由先验引起的射速变化不是恒定的,而是随时间增加的;换句话说,存在增加的偏置信号。较低的先验值(即对T的偏差在里面方向)导致堆积速率降低(图7b条) (第页<0.01),尽管效果不如高先验那么明显。这种基于回归的累积率分析建立了先验概率的粗略神经关联,而不依赖于我们提出的理论。然而,我们注意到,在较低的运动强度下,由先前运动引起的累积速率变化更为显著(第页< 0.01). 这一观察结果与偏差信号幅度随时间的增加相一致,因为持续时间较长的决定往往是在低相干度试验中作出的决定。

为了更好地理解这种效应的时间依赖性,我们使用了一个滑动窗口来估计中性试验和不相等试验之间的累积率差异,作为试验期间时间的函数(见材料和方法)。我们将重点放在0%相干运动强度上进行分析,因为这些试验的决策时间最长。分析结果如所示图7,c(c)d日.当优先选择T在里面,随着决策形成过程中时间的推移,积累率的差异更加显著。这表明偏差信号不仅在增加,而且随着所用决策时间的增加而加速。当优先选择T外面的正如预期的那样,堆积率的差异具有相反的迹象,并且在试验的后期堆积率差异的大小也会增加。该分析证实了先验概率将一个与时间相关的信号加到(或减去)LIP的尖峰率上,并提供了对该信号形状的直接估计。

我们使用第二种技术,利用所有运动强度下的响应推导出偏置信号的动态分量。每个运动强度的先验值导致的累积速率差异是偏置信号变化速率的线性近似值。由于不同的运动强度与不同的RT相关,因此每次我们都计算这些线性近似值的“平均值”,并根据每个连贯性尚未终止的试验的百分比对其进行加权(见材料和方法)。这为偏置信号的变化率提供了分段函数。为了得到偏置信号,只需对分段变化率函数进行积分,并添加从偏移分析中得出的静态偏移分量(见上文;材料和方法)。这产生了神经衍生的动态偏置信号,如图7,e(电子)(f)为了测试该偏差信号是否显著,我们使用自举程序来建立完整偏差信号及其动态分量的置信区间。两者在任何时候都很重要(第页< 0.05). 类似的分析还表明,当将分析限制在以相同扫视选择结束的试验时,神经衍生的偏置信号仍然显著(见材料和方法;第页< 0.05).

神经衍生的偏差信号类似于理论上提出的偏差信号,以解释选择和RT函数的变化。两者都随着经过的决策时间而增加(图8). 更具信息量的分析是将神经衍生的偏差信号纳入用于解释猴子选择和RT的有界扩散模型。为了实现这一点,我们将神经偏差信号表示为在中性先验条件下界限偏移的一部分。然后,我们尝试使用神经衍生的偏差信号来预测非中性先验下的行为。这与我们在快速准确的情况下对人类受试者进行预测时使用的策略相同。我们推导了中性先验下边界和决策变量的模型,并尝试通过添加偏差信号来预测行为。这里,我们使用神经衍生的偏置信号,而不是从TDA函数衍生的信号。如所示图8b条根据神经衍生的偏倚信号预测的选择和反应时间的变化与猴子的行为有合理的一致性(2= 0.87). 对应于不等先验数据的虚线曲线是预测,而不是拟合。仅使用中性先验数据进行拟合(实心曲线)。

作为对我们想法的最后一个测试,我们在一个试验一个试验的基础上检查了神经衍生的偏见信号是否影响猴子的选择。为了评估这一点,我们使用了决策形成开始时的射击速度和决策形成期间的反应积累速度的单次试验测量。对于这两种测量方法,我们将每个神经元的反应标准化,以消除实验控制变量的影响:先验概率、刺激运动强度和方向(见材料和方法)。剩下的是初始发射速率的残余变化(z(z)0)和堆积速率(z(z)日分)在以SD为单位表示的决策形成过程中。使用逻辑回归,我们确定这些测量值中的逐次试验变化是否会改变T的对数几率在里面超出刺激解释力和先验概率的选择(等式3). 我们发现,决策形成过程中的初始发射率和累积率对选择具有重要影响(z(z)0, β= 0.30,第页< 0.001;z(z)日分, β4= 0.97,第页< 0.001).

因为其他研究表明,在做出决策之前,LIP中的选择偏差与神经相关(塞德曼,1998;Platt和Glimcher,1999年;Shadlen和Newsome,2001年; 但请看Gold等人,2008年),我们想测试运动开始前的心率变化是否对选择有额外的解释力。因此,我们增加了一个术语β5z(z)之前,在logistic回归中(公式5),其中z(z)之前是运动开始前200毫秒内的标准化响应。我们发现,这个参数对选择没有显著影响(β5= −0.02,第页=0.51),而z(z)0z(z)日分没有明显变化(β= 0.31, β4= 0.97,第页<0.001)。这表明,运动前反应对选择的任何影响都是通过动态偏差信号进行调节的。

讨论

我们发现,人类和非人类灵长类动物通过向DV中添加动态偏差信号,将先验概率信息纳入感知决策中。所谓动态,我们的意思是偏置信号根据时间将DV偏移不同的量。乍一看,这似乎很奇怪,因为先验概率是时间的常数函数。然而,当决策时间取决于证据的可靠性且DV不以概率为单位时,该策略是明智的。在这种情况下,DV和概率之间的映射随时间而变化。动态偏差信号允许决策者适当地为高质量的证据分配更大的影响力,同时在证据不太可靠时让先验对决策施加更多的影响力。

我们发现,结合该策略的有界累积模型描述了人类和猴子的先验概率对选择和反应时间的影响。这个想法为当决策时间和证据可靠性之间的映射发生改变时,先验概率如何影响选择和RT提供了一个原则性理论。我们发现,当要求受试者改变速度-精度设定值时,这些预测是令人满意的。最后,我们发现在执行任务的猴子的LIP反应中加入了动态偏差信号的神经相关性。该信号的来源未知,但可能与LIP中报告的与时间和紧急程度相关的其他时间相关信号有关(Leon和Shadlen,2000年;Janssen和Shadlen,2005年;Maimon和Assad,2006年;Churchland等人,2008年). 然而,与这些动态信号不同,添加到一个累加器中的内容(例如,用于向右选择)必须从另一个累加器中减去。

我们的理论修正了主流观点,即先验概率作为DV或决策界限的静态变化被纳入决策过程(爱德华兹,1965年;Link and Heath,1975年;卡彭特和威廉姆斯,1995年;Platt和Glimcher,1999年;Gold等人,2008年;Ratcliff和McCooon,2008年;Simen等人,2009年). 静态偏置信号的一个重要灵感来自序列概率比测试(SPRT)(瓦尔德,1947年;Wald和Wolfowitz,1947年). 在SPRT中,DV表示的累积LLR的界意味着精度是恒定的,是决策时间的函数。因此,TDA功能是平坦的。在这种情况下,无论决策时间如何,先验都应该对DV施加同样的影响。这是我们在这里提出的理论的一个特例,在类似于我们在所有试验中使用固定运动强度的决策任务中,有实验支持(Simen等人,2009年).

我们建议的一个优点是,概率隐含在大脑状态和行为结果之间的习得关联中。与SPRT不同,SPRT中的DV是以LLR为单位的,而大脑的DV自然是以尖峰频率为单位表示的,尖峰频率是由运动能量等量的计算产生的(阿德尔森和卑尔根,1985年;Born and Bradley,2005年). 我们建议大脑在特定时间内的DV状态与正确选择的可能性之间形成关联。如果缺乏关于可靠性本身的信息,大脑可以利用通过关联自己的DV和正确决策的概率而获得的知识。

这些条件适用于我们的实验和许多其他情况,在这些情况下,受试者根据假定来自一个来源但来源的可靠性未知的证据流做出决定。如果受试者要知道证据流的可靠性,那么决策过程可以利用这些信息适当地权衡先验信息。例如,如果受试者知道她将被显示为0%相干运动刺激,一个合适的策略是选择受试者喜欢的方向并立即回答。

相反,当可靠性未知时,我们的策略是有用的,也就是所谓的不确定性。当受试者面对可靠性不确定的证据流时,决策规则会在给定决策时间的DV状态与正确选择的概率之间建立关联。在这种情况下,经过的时间提供了有关证据可靠性的信息(Kiani和Shadlen,2009年). 对于有界累积过程,动态偏差信号可以被视为一种在给定的停止时间内边缘化证据可靠性分布的方法。因此,我们的理论与贝叶斯方法是一致的,即主体对证据可靠性的知识来自经过的决策时间。

大脑确定DV状态与正确选择概率之间关联的方法仍然是一个悬而未决的问题。尽管我们提出我们的想法是向规范理论迈进的一步,但将其视为原则性启发式可能更合适。如上所述,我们的具体建议假设关联是在中立先验下,在给定的决策时间内与预期性能形成的。然而,添加偏置信号也可能会影响此计算。例如,先前的知识可能会促进采用不同的速度制度,或希望采用不同的TDA,而不是我们提案中的TDA。我们的理论并没有为这个问题提供完整的规范性解决方案。然而,通过将关于先验概率的新信息合并到现有的、可接受的框架中,允许对该信息进行校准,我们的理论提供了一种明智而直接的方法。

这一理论超越了不太原则的启发式。在有界累积或漂移扩散机制的背景下,人们可以考虑偏差是否会改变过程的起点或漂移率。虽然当DV到概率单位的转换在整个试验期间保持不变时,起点偏移提供了标准的解决方案,但当精度依赖于时间时,这种解决方案并不合适。因此,在我们的受试者中,起点偏移与选择模式和RT不一致也就不足为奇了。漂移率的变化引入了随时间线性变化的偏置信号(阿什比,1983年;Diederich和Busemeyer,2006年). 漂移率的这种增加是对我们提出的偏置信号动态分量的合理近似。然而,我们的建议为先验知识对DV的影响提供了一个原则性的理由。与其他确定拟合参数的建议不同,我们的理论规定了面对先验的行为偏差的变化幅度,并预测了不同条件下,如速度-精度机制的变化,这种幅度的变化。我们需要符合受试者对先前的内部估计,这在一定程度上缓解了这种虚张声势。然而,受试者低估先验值(<1)并不奇怪,因为有充分的理由将先验偏向中性[先验概率上的先验(很好,1983年)]. 无论是什么原因,我们的人类受试者在不同的速度-准确性制度下似乎持有相同的偏见先验。

我们提出的想法可以扩展到更复杂的决策以及影响成本和风险的报酬结构的其他变化。中心思想是,决策终止时DV的状态与一组基准结果相关联。如果一个神经放电率(例如,在LIP中)代表一个DV,那么关联指定放电率与基准单位的比例,作为决策时间的函数。在这里所追求的公式中,基准结果是当DV处于终止界限时正确选择的概率,因此缩放是从DV相对于界限到对数概率单位。基准还可以包括与不同选择相关的激励措施和成本。因此,当证据的可靠性存在不确定性时,不对称奖励也应产生动态偏差信号。

最近的研究使用猴子运动辨别任务的固定刺激持续时间版本来检测这种操作的效果(Feng等人,2009年). 在这种固定持续时间的设计中,行为数据无法区分静态偏置和动态偏置信号。然而,LIP的记录提供了静态偏移的证据,而没有提供动态偏移信号的证据(Rorie等人,2010年). 我们认为,对任务的RT版本执行相同的操作可能会对我们的理论进行更敏感的测试。

有充分的理由相信,经过的时间可能会影响决策过程的计算。长时间的考虑会付出时间的代价。为了降低这一成本,建议使用实现“决策紧急性”的时间相关信号作为施加软截止日期的一种方式(Churchland等人,2008年;Cisek等人,2009年). 除了被用来控制过度深思熟虑之外,消逝的时间似乎也在感官证据的评估中发挥了作用。研究发现,受试者使用累积证据和观看时间的组合来确定他们的信心水平;也就是说,根据积累证据所花的时间,相同数量的积累证据似乎能提供不同程度的信心(Kiani和Shadlen,2009年). 根据我们的结果,在将积累的证据与先前的信息相结合时,似乎使用了类似的策略。这支持了更普遍的结论,即大脑可以利用经过的决策时间来校准概率量的神经表示。因此,峰值频率和概率之间的映射存在固有的延展性,这种延展性至少部分取决于时间。

脚注

这项工作得到了霍华德·休斯医学研究所(HHMI)、国家眼科研究所拨款EY11378和国家研究资源中心拨款RR00166的支持。T.D.H.得到了HHMI产前研究金的支持。M.E.M.获得了美国国立卫生研究院(National Institutes of Health Training Grant)GM07108资助、Poncin资助和大学科学家成就奖(Achievement Rewards for College Scientists fellow)。E.H.得到了德国学术交流服务的支持。我们感谢John Palmer、Ruben Moreno-Bote、Alex Pouget、Jan Drugowitsch和Tianming Yang的周到讨论,感谢Melissa Mihali和Lori Jasinski的技术援助。

工具书类

  • Adelson EH,Bergen JR。运动感知的时空能量模型。美国光学学会杂志。1985;2:284–299.[公共医学][谷歌学者]
  • Ashby FG.两种选择反应时间的有偏随机游走模型。数学心理学杂志。1983;27:277–297. [谷歌学者]
  • 巴洛HB。模式识别和感觉神经元的反应。美国科学院。1969;156:872–881.[公共医学][谷歌学者]
  • Basso MA,Wurtz RH.靶概率变化对上丘神经元活动的调节。神经科学杂志。1998;18:7519–7534. [PMC免费文章][公共医学][谷歌学者]
  • Beck JM、Ma WJ、Kiani R、Hanks T、Churchland AK、Roitman J、Shadlen MN、Latham PE、Pouget A.贝叶斯决策的概率总体代码。神经元。2008;60:1142–1152. [PMC免费文章][公共医学][谷歌学者]
  • Bisley JW,Krishna BS,Goldberg ME。后顶叶皮层快速准确的反应。神经科学杂志。2004;24:1833–1838. [PMC免费文章][公共医学][谷歌学者]
  • Bogacz R、Brown E、Moehlis J、Holmes P、Cohen JD。最佳决策的物理学:对两种替代性强迫选择任务的绩效模型的形式化分析。心理学评论。2006;113:700–765.[公共医学][谷歌学者]
  • 出生于RT,Bradley DC。可视区MT的结构和功能。《神经科学年鉴》。2005;28:157–189.[公共医学][谷歌学者]
  • Brainard DH公司。心理物理学工具箱。Spat视力。1997;10:433–436.[公共医学][谷歌学者]
  • Britten KH、Shadlen MN、Newsome WT、Movshon JA。猕猴MT神经元对随机运动信号的反应。视觉神经科学。1993;10:1157–1169.[公共医学][谷歌学者]
  • Carpenter RH,Williams ML。扫视眼动控制中对数似然的神经计算。自然。1995;377:59–62.[公共医学][谷歌学者]
  • Chang JS,Cooper G.福克-普朗克方程的实用差分格式。《复合生理学杂志》。1970;6:1–16. [谷歌学者]
  • Churchland AK、Kiani R、Shadlen MN。多个备选方案的决策。自然神经科学。2008;11:693–702. [PMC免费文章][公共医学][谷歌学者]
  • Cisek P,Puskas GA,El-Murr S.变化条件下的决策:紧急关口模型。神经科学杂志。2009;29:11560–11571. [PMC免费文章][公共医学][谷歌学者]
  • Cohen MR,Newsome WT。单个神经元对感知的贡献取决于时间尺度和噪声相关性。神经科学杂志。2009;29:6635–6648. [PMC免费文章][公共医学][谷歌学者]
  • Diederich A,Busemeyer JR。感知辨别任务中回报对反应偏差的影响建模:有界变化、漂移变化或两阶段加工假设。感知心理。2006;68:194–207.[公共医学][谷歌学者]
  • Ditterich J.时变决策的证据。欧洲神经病学杂志。2006;24:3628–3641.[公共医学][谷歌学者]
  • 爱德华兹·W·寻找信息的最佳策略:统计模型、选择反应时间和人类信息处理。数学心理学杂志。1965;2:312–329. [谷歌学者]
  • Feng S、Holmes P、Rorie A、Newsome WT。猴子在面对嘈杂的刺激和不平等的奖励时能做出最佳选择吗?公共科学图书馆计算生物学。2009;5:e1000284。 [PMC免费文章][公共医学][谷歌学者]
  • Glimcher PW.视觉-随机决策的神经生物学。《神经科学年鉴》。2003;26:133–179.[公共医学][谷歌学者]
  • 安徒生RA,Gnadt JW。猕猴后顶叶皮层的记忆相关运动规划活动。实验脑研究。1988;70:216–220.[公共医学][谷歌学者]
  • Gold JI,Shadlen MN。关于感官刺激决策的神经计算。趋势认知科学。2001;5:10–16.[公共医学][谷歌学者]
  • Gold JI,Shadlen MN。班布里斯穆斯与大脑:解码感官刺激、决策和奖励之间的关系。神经元。2002;36:299–308.[公共医学][谷歌学者]
  • Gold JI,Shadlen MN。决策的神经基础。《神经科学年鉴》。2007;30:535–574.[公共医学][谷歌学者]
  • Gold JI,Law CT,Connolly P,Bennur S.知觉学习期间先验和感觉证据对动眼神经决策变量的相对影响。神经生理学杂志。2008;100:2653–2668. [PMC免费文章][公共医学][谷歌学者]
  • IJ很好。好的思维:概率的基础及其应用。明尼阿波利斯:明尼苏达大学;1983[谷歌学者]
  • Hanks TD,Ditterich J,Shadlen MN。猕猴区域LIP的微刺激影响运动辨别任务中的决策。自然神经科学。2006;9:682–689. [PMC免费文章][公共医学][谷歌学者]
  • Hikosaka O,Wurtz RH.猴黑质网状部的视觉和动眼神经功能。三、 记忆控制的视觉和扫视反应。神经生理学杂志。1983;49:1268–1284.[公共医学][谷歌学者]
  • Huk AC,Shadlen MN。猕猴顶叶皮层的神经活动反映了知觉决策过程中视觉运动信号的时间整合。神经科学杂志。2005;25:10420–10436. [PMC免费文章][公共医学][谷歌学者]
  • Janssen P,Shadlen MN。猕猴区域LIP中消逝时间危险率的表示。自然神经科学。2005;8:234–241.[公共医学][谷歌学者]
  • Jaynes ET公司。概率论:科学的逻辑。英国剑桥:剑桥大学;2003[谷歌学者]
  • Jazayeri M,日本莫夫松。神经群体对感官信息的最佳表示。自然神经科学。2006;9:690–696.[公共医学][谷歌学者]
  • 杰弗里斯·H·。概率论,第3版。牛津:克拉伦登;1961[谷歌学者]
  • Kass RE、Raftery A.Bayes因子。美国统计协会。1995;90:773–795. [谷歌学者]
  • Kiani R,Shadlen MN。与顶叶皮层神经元决策相关的信心表示。科学。2009;324:759–764. [PMC免费文章][公共医学][谷歌学者]
  • Kiani R,Hanks TD,Shadlen MN。即使观看时间由环境决定,顶叶皮层的有限整合也是决定的基础。神经科学杂志。2008;28:3017–3029. [PMC免费文章][公共医学][谷歌学者]
  • 拉明DRJ。选择反应时间的信息论。伦敦:学术;1968[谷歌学者]
  • Leon MI,Shadlen MN。猕猴LIP区神经元对消逝时间的表示。Soc神经科学文摘。2000;26:249–213. [谷歌学者]
  • Lewis JW,Van Essen DC。猕猴顶叶视觉、感觉运动和多模式处理区域的皮层连接。《计算机神经学杂志》。2000;428:112–137.[公共医学][谷歌学者]
  • 链接软件。差异与相似的波动理论。新泽西州希尔斯代尔:埃尔鲍姆;1992[谷歌学者]
  • 链接SW,Heath RA。心理歧视的序贯理论。心理测量学。1975;40:77–105. [谷歌学者]
  • Ma WJ,Beck JM,Latham PE,Pouget A.概率总体码的贝叶斯推断。自然神经科学。2006;9:1432–1438.[公共医学][谷歌学者]
  • 马萨诸塞州阿萨德市Maimon G。猕猴LIP主动行动时机的认知信号。自然神经科学。2006;9:948–955.[公共医学][谷歌学者]
  • Mazurek ME、Roitman JD、Ditterich J、Shadlen MN。神经整合者在感知决策中的作用。大脑皮层。2003;13:1257–1269.[公共医学][谷歌学者]
  • Palmer J,Huk AC,Shadlen MN。刺激强度对感知决策速度和准确性的影响。J视觉。2005;5:376–404.[公共医学][谷歌学者]
  • Platt ML,Glimcher PW.顶叶皮层决策变量的神经相关性。自然。1999;400:233–238.[公共医学][谷歌学者]
  • Platt ML,Huettel SA。风险商业:不确定性下决策的神经经济学。自然神经科学。2008;11:398–403. [PMC免费文章][公共医学][谷歌学者]
  • 按WH、Flannery BP、Teukolsky SA、Vetterling WT。C中的数字配方。英国剑桥:剑桥大学;1988.[谷歌学者]
  • Rao RP。递归神经电路中的贝叶斯计算。神经计算。2004;16:1–38.[公共医学][谷歌学者]
  • Ratcliff R,McCooon G。扩散决策模型:双选择决策任务的理论和数据。神经计算。2008;20:873–922. [PMC免费文章][公共医学][谷歌学者]
  • Ratcliff R,Rouder JN。为两种选择决策建模响应时间。心理科学。1998;9:347–356. [谷歌学者]
  • Ratcliff R,Smith PL.两种选择反应时间的序贯抽样模型比较。心理学评论。2004;111:333–367. [PMC免费文章][公共医学][谷歌学者]
  • Reddi BA、Asrress KN、Carpenter RH。扫视决策任务中的准确性、信息和响应时间。神经生理学杂志。2003;90:3538–3546.[公共医学][谷歌学者]
  • Roitman JD,Shadlen MN。在组合视觉辨别反应时间任务中,顶内外侧区域神经元的反应。神经科学杂志。2002;22:9475–9489. [PMC免费文章][公共医学][谷歌学者]
  • Romo R、Hernández A、Zainos A。腹侧运动前皮质中感知决策的神经元相关性。神经元。2004;41:165–173.[公共医学][谷歌学者]
  • Rorie AE,Gao J,McClelland JL,Newsome WT.猕猴外侧顶叶皮层(LIP)知觉决策过程中感觉和奖赏信息的整合。公共科学图书馆一号。2010;5:e9308。 [PMC免费文章][公共医学][谷歌学者]
  • Schall JD,Thompson KG。视觉引导眼球运动的神经选择和控制。《神经科学年鉴》。1999;22:241–259.[公共医学][谷歌学者]
  • 斯坦福大学神经科学项目;1998年。在方向辨别任务中调节视觉信号转换为感知决策的神经机制。博士论文。[谷歌学者]
  • Shadlen MN,Newsome WT。恒河猴顶叶皮层(LIP区)感知决策的神经基础。神经生理学杂志。2001;86:1916–1936.[公共医学][谷歌学者]
  • Shadlen MN、Hanks TD、Churchland AK、Kiani R、Yang T。简单感知决策的速度和准确性:数学入门。收录人:Doya K、Ishii S、Rao R、Pouget A,编辑。贝叶斯大脑:神经编码的概率方法。马萨诸塞州剑桥:麻省理工学院;2006年,第209-237页。[谷歌学者]
  • Simen P、Contreras D、Buck C、Hu P、Holmes P、Cohen JD。两种选择决策中的报酬率优化:理论预测的实证检验。J实验心理休谟知觉表现。2009;35:1865–1897. [PMC免费文章][公共医学][谷歌学者]
  • Sugrue LP、Corrado GS、Newsome WT。顶叶皮层的匹配行为和价值表征。科学。2004;304:1782–1787.[公共医学][谷歌学者]
  • Van Essen DC、Drury HA、Dickson J、Harwell J、Hanlon D、Anderson CH。用于大脑皮层表面分析的集成软件套件。美国医学信息协会。2001;8:443–459. [PMC免费文章][公共医学][谷歌学者]
  • 沃尔德A。序列分析。纽约:Wiley;1947[谷歌学者]
  • Wald A,Wolfowitz J.序贯概率比检验的最佳特征。数学统计年鉴。1947;19:326–339. [谷歌学者]
  • Zemel RS,Dayan P,Pouget A.人口代码的概率解释。神经计算。1998;10:403–430.[公共医学][谷歌学者]

文章来自神经科学杂志由以下人员提供神经科学学会