跳到主要内容
访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
公共科学图书馆计算生物学。2023年6月;19(6):e1011104。
2023年6月8日在线发布。 数字对象标识:10.1371/日记.pcbi.1011104
预防性维修识别码:项目编号1249884
PMID:37289753

环境动力学塑造感知决策偏差

朱莉·查尔顿,概念化,形式化分析,调查,写作-初稿,写作–审查和编辑,1,?一个 威克托·F·Młynarski,方法,写作-初稿,2 Yoon H.Bai,软件,1,?b个 安·M·赫蒙德斯塔,方法,写作-初稿,写作–审查和编辑,罗布·L·T·戈里斯,概念化,资金获取,方法,监督,写作-初稿,写作–审查和编辑通讯作者1,*
Alireza Soltani,编辑器

关联数据

补充资料
数据可用性声明

摘要

为了解释感官环境,大脑将模糊的感官测量与反映特定情境的先前经验的知识相结合。但环境背景可能会突然发生不可预测的变化,从而导致当前环境的不确定性。在这里,我们解决了两个问题:特定情境的先验知识如何在不断变化的环境中最佳地指导感官刺激的解释,人类的决策策略是否与这种最佳策略相似?我们通过一项任务来探讨这些问题,在该任务中,受试者报告从代表不同环境背景的三种动态切换分布中提取的模糊视觉刺激的方向。我们推导出理想贝叶斯观测器的预测,该观测器利用有关任务统计结构的知识来最大化决策准确性,包括有关环境动态的知识。我们表明,它的决策受到动态变化的任务上下文的影响。这种决策偏差的大小取决于观察者对当前环境不断演变的信念。因此,该模型不仅预测,随着上下文被更可靠地指示,决策偏差将增加,而且随着环境稳定性的增加,以及自上次上下文切换以来试验次数的增加。对人类选择数据的分析验证了所有三种预测,表明大脑在解释模糊的感官信号时利用了环境变化统计结构的知识。

作者摘要

当感觉信息模棱两可时,大脑依靠先验知识进行感知推断。然而,当环境背景发生变化时,适当的先验知识往往会随之发生变化。这里,我们开发了一个贝叶斯观测器模型,以研究当感知信息和环境背景都不确定时,如何进行最优的感知推断。该策略的行为特征是一种上下文适当的决策偏差,其强度随着上下文线索的可靠性、环境的稳定性以及自最近上下文变化以来的决策数量而增长。我们在执行动态方向辨别任务的人类受试者的行为中准确地确定了这种模式。总之,我们的结果表明,在动态环境中,我们对模糊感官测量的感知解释取决于我们对变化可能性的潜在信念。

介绍

为了实现目标,面对不确定性和变化,人类和其他动物必须推断环境的特性[1,2]. 先验知识通常用于指导基于模糊感官测量的感知决策[6]. 然而,在一种情况下相关的知识如果应用于另一种情况,可能会导致更糟糕的结果[79]. 当感知不确定性与是否发生了上下文变化的额外不确定性相结合时,就会出现一个复杂的挑战[10,11]. 举个例子,假设你正在一块地里寻找成熟的香蕉。一些香蕉明显是绿色或黄色的,很容易判断,但许多是模糊的(图1A). 事先了解遇到成熟香蕉的可能性有助于做出更准确的决定。生长在阳光充足的小树林中的香蕉更容易成熟,而生长在阴凉的小树林里的香蕉则不太可能成熟。当你在阳光照射下穿过田野时,很容易识别出阳光明媚和荫凉的小树林,并使用适当的先验知识。但是云层形成了,晴朗的小树林和阴凉的小树林之间的差别变得不那么明显了。面对感知解释和环境背景的不确定性,情境特定知识如何保持有用?

保存图片、插图等的外部文件。对象名称为pcbi.1011104.g001.jpg
动态环境中的贝叶斯决策示例。

(a) 黄色的香蕉比绿色的香蕉更容易成熟。(b) 与给定颜色感知器相关联的似然分布。(c) 生长在阴凉和阳光下的香蕉的条件颜色分布。(d) 贝叶斯觅食策略的说明。当环境上下文确定时(左侧,插图),关联的颜色分布指定优先。先验和似然的乘积表示后验。先验对后验的影响取决于似然和先验的相对强度。(e) 当香蕉黄度超过某一固定标准的概率超过50%时,觅食者决定香蕉成熟。根据水果的颜色绘制最终的选择行为。绿色虚线说明了在缺乏先验知识的情况下的这种关系,橙色实线说明了贝叶斯觅食者的这种关系。先验使决策产生偏差。(f) 当觅食者从一个树林移到另一个树林时,她遇到了难以察觉的环境变化。当上下文不确定时,贝叶斯决策者通过线性混合两种颜色分布来构造先验,权重由连续变化的上下文信念确定。(g) 如果语境包含了关于环境动力学的知识,语境特定知识对选择行为的影响在语境转换后是最小的,并且会在语境转换不间断的一系列决策中增长。

贝叶斯推理提供了一个规范性框架,该框架规定了在不确定性下作出决策时,如何以最佳方式利用不同形式的知识[12]. 在上面的例子中,关于感知模糊性的知识和关于阴凉和阳光充足的小树林中可能的香蕉颜色的知识都可以利用。具体来说,感知模糊性的知识被用来计算给定香蕉真颜色的感知颜色的可能性(图1B),而关于阴凉和阳光充足的树林中可能的香蕉颜色的知识被总结为特定于上下文的先验信念(图1C). 先验和似然的归一化乘积产生一个后验信念(图1D,左),贝叶斯决策者使用它来决定是否摘香蕉(图1E,左)。先验对决策的影响取决于先验和可能性的相对强度。当感官测量高度模糊时(例如,在黄昏评估颜色时),似然函数很宽,相同的先验对后面的影响较大(图1D和1E,中间面板)。另一方面,当环境背景仅弱地规定了颜色的分布时(例如,在有斑驳灯光的小树林中),优先权是广泛的,影响相对较小(图1D和1E,右侧面板)。

在这里,我们开发了一个贝叶斯理想观测器模型,将这些规范性预测扩展到动态环境中。这个“动态”模型的关键是,它还利用了有关环境动力学统计结构的知识来解释模糊的感官测量。它通过构建一个关于当前语境的持续进化的后验信念来实现这一点,该后验信念告知前验过度刺激(图1F). 与上面描述的“静态”模型一样,该模型预测,当上下文被更可靠地指示时,观察者对当前上下文的身份更加确定,并将表现出更大的整体上下文适当偏差(以下简称“对齐偏差”)。然而,动态策略还具有两个不同的特征:首先,当环境更稳定时(即上下文切换发生的频率降低),观察者总体上对上下文更确定,从而导致更大程度的对齐偏差。第二,当观察者在同一背景下做出更多决定时,他们对当前背景的身份更加确定,他们的一致偏见也会增加(图1G).

然后,我们询问人类观察员在动态环境中做出决策时是否同样利用多种形式的知识。研究人员向受试者简要介绍了一个漂移光栅,并要求他们判断其方向。刺激来自三个动态切换分布中的一个,每个都代表特定的环境背景。在每次试验开始时,一个模糊的线索(注视标记的颜色)指示了当前的上下文。受试者没有被告知这条线索意味着什么,但在之前的训练中经历了相关的刺激分布。对人类选择行为的分析揭示了环境的动态演变影响,这与我们的动态贝叶斯理想观测者的预测类似。这些结果表明,大脑利用有关环境变化统计结构的知识来应对不确定和不稳定环境带来的挑战。

结果

12名人类受试者执行了一项双选择强迫选择(2AFC)定向辨别任务,在每次试验中,他们判断周围视觉刺激相对于垂直方向是顺时针旋转还是逆时针旋转(方法)。激励由具有可变方向和对比度的漂移光栅组成(图2A,顶部)。观察者在三种不同刺激方向分布的背景下执行任务(图2A,底部)。上下文切换是伪随机的。在最初的训练阶段,上下文切换相对较少,但在随后的测试阶段频繁发生(方法)。为了量化任务的这一方面,我们计算了自最近一次上下文切换以来每次试验的次数。该指标在各试验中近似呈指数分布,在训练阶段的平均值为15.9次试验,在测试阶段为2.35次试验(图2B).

保存图片、插图等的外部文件。对象名称为pcbi.1011104.g002.jpg
动态2AFC方位识别的贝叶斯理想观测器模型。

(a) 模型模拟中使用的刺激方向的上下文特定分布。刺激对比度在两个水平上不同。(b) 在实验的训练和测试阶段,来自最近上下文切换的试验数量的交叉试验分布。(c) 各种贝叶斯理想观测者的表现,他们具备关于感官测量模糊性的一般知识(模型1),以及关于上下文线索可靠性的知识(模型2),以及有关感官测量对比度特定模糊性的知识(模型3),加上关于上下文切换可能性的知识(模型4)。

由于几个不同的原因,这项任务很困难。首先,刺激强度(即旋转幅度)弱于定向的感知灵敏度[13,14]. 其次,在低对比度下,知觉敏感性进一步降低,刺激方向的不确定性增加[15,16]. 第三,虽然可以利用特定情境的规则来提高绩效(即三分之二的情境与方向的倾斜分布有关),但环境一直在变化,让观察者对任何给定试验的潜在情境都可能不确定。如上所述,面对这些挑战的贝叶斯决策者通过利用其对任务统计结构的知识来最大限度地提高绩效。

为了研究不同形式的知识的有用性,我们评估了贝叶斯理想观测器的任务性能,该观测器了解越来越多的任务组件(方法)。像我们的人类受试者一样,理想的观察者被呈现一系列定向刺激,并被要求在每次试验中决定给定刺激是顺时针旋转还是逆时针旋转。它是基于刺激方向的噪声测量和模糊的上下文线索来实现的。我们的理想观测者中最不知情的人只对感知的模糊性有一般的了解,这使得他们能够计算出在刺激物的真实方位下进行感官测量的可能性,而刺激物正是利用这个方位来做出决定的。该观察员在61.5%的试验中正确判断了刺激(图2C,最左边的条)。此外,提供线索可靠性和上下文特定刺激分布方面的知识,使理想的观察者能够将该似然函数与关于刺激方向的试验特定先验信念相结合,并基于关于刺激方向产生的后验信念作出决定。这将性能提高了大约一个百分点(图2C,第二巴)。进一步了解对比度对方向敏感性的影响,可以让理想的观测者建立对比度特定的似然函数,从而获得额外的性能优势(图2C,第三巴)。最后,提供关于上下文变化的统计概率的知识可以使理想的观察者进一步减少其对当前上下文的不确定性,从而再次提高任务性能(图2C,最右边的条)。因此,在感知决策任务中,有关环境动力学的知识可以与通常与贝叶斯推理相关的其他形式的知识一样有用。

动态方位判别的贝叶斯理想观测器模型

为了识别该任务的最优决策策略的特征,我们研究了动态贝叶斯理想观测器模型的选择行为。该观察者利用多种形式的知识。它知道环境以固定的速度在三个离散的上下文之间切换,并且它知道每个上下文中刺激的潜在分布。因为它还假设上下文线索本身是模糊的,所以它使用传入的上下文线索和有关环境动力学的知识来不断更新其对当前上下文的后验信念,这反过来又决定了其对当前试验刺激方向的前验信念(方法,图3A).

保存图片、插图等的外部文件。对象名称为pcbi.1011104.g003.jpg
动态2AFC方位识别的贝叶斯理想观测器模型。

(a) 贝叶斯理想观测器决策过程示意图。(b) 模型选择行为的摘要。顺时针选择的比例是根据刺激方向绘制的,由任务上下文(不同的线条)和刺激对比度(顶部与底部)划分出来。(c) 低对比度校准偏差的演变与试验次数有关,因为上下文切换由假定的危险率(顶部)和假定的上下文线索可靠性(底部)分开。灰色曲线说明了动态理想观测器模型(中的模型4图2C),棕色曲线说明了静态模拟(图中的模型3图2C).

动态推理策略体现在无法从任何个人选择中推断出的决策模式中,而是在选择与任务变量之间的关系中变得明显。为了揭示这种关系,我们在任务中模拟和分析了大量试验的决策。我们首先验证了动态推理与消息灵通的静态推理(即图2C). 将平均选择行为绘制为刺激方向的函数,并由潜在的任务控制分解出来,这表明动态理想观察者的决策既依赖于感官刺激测量,也依赖于特定情境的先验知识(图3B). 上下文对决策的影响取决于先验和可能性的相对强度。例如,在低对比度环境中,感官方向测量的不确定性更大(即可能性更大),刺激方向和行为选择之间的关联性更弱,如线条的较浅斜率所示。理想的观察者自然会通过更加依赖特定于上下文的知识来补偿这种信息损失。这导致了更强的对齐偏差,这可以从线之间增加的水平间隔中得到证明(图3B). 我们通过计算统一上下文中主观平等点(定义为导致50%顺时针选择的方向)的平均变化来量化上下文对决策的影响。

除了上述影响外,动态推理如何唯一地影响决策偏差?当语境发生变化时,随着时间的推移,作为理想观察者对语境不断演变的信念的函数,先前的过度刺激自然会减弱和加强。语境转换后,传入刺激和语境线索与理想观察者对语境的信念发生冲突,导致语境的不确定性增加,后语境减弱。这反过来又导致刺激优先权的减弱,刺激优先权将从单一的上下文特定分布演变为混合分布(参见图3A,中间)。随着理想观察者在一个环境中完成更多的试验,其一致偏见的演变明显地表明,由于对环境的确定性增加,先验得到了加强。图3C显示了理想观测者对任务的确切统计结构(灰色曲线)采用的不同假设下,低对比度设置中对齐偏差的时间演变。考虑整体趋势。在上下文切换之后,理想的观测者对当前上下文具有很高的不确定性,并且上下文诱导的偏差最小。当理想的观察者在一个环境中进行更多的试验时,它会不断更新自己的信念,减少对当前环境的不确定性,并且一致的偏见也会增加。

对齐偏差的特定模式取决于理想观测者对环境稳定性和上下文线索可靠性的基本假设。当理想观测者假设环境有些稳定时(即,假设上下文切换的概率小于0.5;图3C,top)和上下文提示不明确(图3C,底部)。环境的假设稳定性越高,上下文线索的假设可靠性越低,对齐偏差完全饱和所需的时间越长(图3C). 当假设上下文变化的可能性较小且线索更可靠时,对齐偏差饱和的水平更高(图3C). 校准偏差的时间演变也取决于自以前的上下文切换。环境越稳定,理想观察者对前一背景的信念越强,因此更新该信念所需的证据(时间)越多,背景对选择产生最大影响所需的时间也越长(图AaS1文本). 然而,从图Ab中偏置矩阵行之间颜色的细微水平偏移可以看出S1文本与语境稳定性的总体影响相比,这种影响通常较弱。最后,请注意,即使在最极端的情况下,对齐偏差也不会变为负值。原则上,这是可能发生的。然而,在我们研究的特定条件下,它没有。

总之,动态贝叶斯理想观测器使用层次推理策略来执行我们的任务。这会产生受任务上下文影响的方向判断。这种效应的大小不仅取决于刺激对比度,还取决于观察者对上下文线索可靠性、环境稳定性的信念,以及自最近一次上下文切换以来的试验次数。最后两个效应与利用环境动力学知识改善不确定感知决策有着独特的关联(图3C棕色与灰色曲线)。

线索可靠性、上下文波动性和感官不确定性对人类选择行为的影响

人类在动态环境中做出感知决策时,会利用哪些知识?利用有关特定情境的先验知识和感知模糊性偏见,可以做出不确定的感知决策[9]. 因此,决策偏差可能有很多根源。但是,如果它是通过利用这些形式的知识而产生的,那么它将受到上下文线索的可靠性和感官不确定性水平的调节。最后,如我们所示,在更不稳定的环境中以及上下文切换后,额外利用关于任务层次结构和环境稳定性的知识将削弱这种偏见。为了测试这些预测,我们操纵了关键任务统计数据,并对人类的选择行为进行了几次有针对性的分析。为了研究上下文线索可靠性的影响,我们将每个受试者分配到两个条件中的一个。在真实线索条件下,上下文线索正确地指示了每一次试验的潜在上下文。在模糊线索条件下,该线索在80%的试验中有效。受试者没有被告知该线索意味着什么,但在最初的训练阶段经历了相关的刺激分布(图4A). 为了研究环境稳定性的影响,上下文切换在训练阶段相对较少,但在随后的测试阶段频繁发生(图4A,顶部)。

保存图片、插图等的外部文件。对象名称为pcbi.1011104.g004.jpg
任务控制下的人类取向判断存在偏差,这种偏差取决于上下文线索的可靠性和环境的稳定性。

(a) 每个受试者在实验的训练和测试阶段完成的试验次数。(b) 底部:在三个动态切换的任务上下文(用颜色表示)下,作为刺激方向函数绘制的示例观察者顺时针选择的比例。符号总结了观察到的选择行为,线条显示了信号检测理论决策模型的拟合度。上图:在模型中,一个刺激会引起一个有噪声的方向估计。与固定标准进行比较会得出结论。(c) 训练和测试阶段归一化偏差的比较。在真实线索条件下,线索可靠性为100%;在模糊线索条件下,线索可靠性为80%P<0.05。

我们首先问到,任务上下文是否会对选择产生偏见,这种偏见取决于上下文线索的可靠性。考虑一个人类观察者的例子,在测试阶段,他们在不同的环境下对相同的刺激做出不同的判断(图4B,底部面板)。为了量化这种影响,我们使用基于信号检测理论(SDT)的决策过程模型描述了数据,该模型指定了“顺时针”选择的概率如何取决于任务变量(方向、对比度和上下文图4B,底部面板)。然后,我们使用该模型测量观察者对刺激方向的不确定性(定义为方向估计中的交叉试验变异性,图4B顶部面板)以及它们的对准偏置的大小。将后一个统计值除以前一个,可以得到对齐偏差的标准化估计值。对于每个受试者,我们分别在训练阶段结束时和测试阶段评估了他们的一致偏差。我们仅在该分析中纳入了相同对比度水平的试验(参见方法). 回想一下,上下文线索在模糊线索条件下的可靠性不如真实线索条件下。正如预测的那样,这导致校准偏差水平降低(图4C). 在训练阶段结束时(真实线索条件的中位偏差=1.084,模糊线索条件的中位数偏差=0.259,P=0.015,单侧Wilcoxon秩和检验),以及测试阶段(真实线索情况的中位偏移=0.31,模糊线索情况的中位数偏移=-0.035,P=0.115),都是如此。这种模式表明,所观察到的决策偏差部分是由于利用了有关特定上下文的先验知识。受试者是否也利用了关于上下文变化率的知识?如图所示图4C测试阶段环境波动性的突然增加降低了每个受试者的校准偏差(标准化偏差的中位数下降=0.435,P<0.001,单侧Wilcoxon符号秩检验,n=11)。这种影响在每种条件下都是显著的(真实线索条件:中位数减少=1.01,P=0.031,n=5;模糊线索条件:中位数减少=0.283,P=0.016,n=6)。我们得出的结论是,随着上下文线索变得更加可靠,对齐偏差会增加,但随着环境变得不那么稳定,对齐偏差会减少。

当感官测量更加不确定时,对感知模糊性有精确知识的贝叶斯观测器将更加依赖于上下文特定的知识。为了测试人类的选择是否表现出类似的模式,我们接下来询问了选择是否以对比依赖的方式受任务上下文的影响。在测试阶段,高对比度和低对比度刺激被伪随机混合(参见方法). 对于每一个受试者,我们独立评估了他们对刺激方向的不确定性,以及他们对高对比度和低对比度刺激的对齐偏差的大小。如图所示图5A,降低刺激对比度会增加除一名受试者外的所有受试者的方向不确定性(不确定性中位数增加=0.303度,P<0.001,单侧Wilcoxon符号秩检验,n=12)。这种影响在每种条件下都是显著的(真实线索条件:中位数增加=0.403度,P=0.016,n=6;模糊线索条件:中位数增加=0.147度,P=0.031,n=5)。在真实提示条件下,降低刺激对比度也会导致更大的对齐偏差,尽管要注意的是,一名受试者(JI)在高对比度或低对比度下都没有表现出上下文依赖性的选择行为(中位数增加=0.248度,P=0.031,n=6;图5B,左侧面板)。在模糊线索条件下,在实验的测试阶段没有一致的对齐偏差(高对比度:中位偏差=–0.032度,P=0.989,n=6;低对比度:中位数偏差=–0.019度,P=0.784,n=5),也没有一致的偏差幅度变化(中位增加=0.018度,P=0.156,n=8;图4B,右侧面板)。因此,当存在时,一致性偏差会随着刺激不确定性的增加而增加。

保存图片、插图等的外部文件。对象名称为pcbi.1011104.g005.jpg
任务控制文本以对比依赖的方式对人的取向判断产生偏见。

(a) 低(纵坐标)和高(横坐标)刺激的方向不确定性对比了真实线索条件(左)和模糊线索条件(右)受试者。(b) 低(纵坐标)和高(横坐标)刺激的对齐偏差对比了真实线索条件(左)和模糊线索条件(右)受试者。误差条反映了68%的置信区间,该置信区间来自1000倍的引导分析(方法)。

到目前为止,我们已经证明了方向判断受到任务背景的影响。这种影响的大小取决于感官测量的可靠性和上下文线索的可靠性。这表明,我们任务中的受试者通常将感知模糊性和特定情境的先验知识纳入他们的决策过程。校准偏差的大小还取决于环境的稳定性。这表明,观察者还可以利用任务层次结构和环境稳定性的知识来解释模糊的感官刺激。为了进一步验证这一假设,我们现在转向自最近的上下文切换(即在当前上下文中花费的时间)以来,对齐偏差是否随着试验次数的变化而变化的问题。

背景转换后的试验对人类选择行为的影响

上下文切换后,上下文对决策的影响是否会随时间而变化?这是一个很难解决的问题,原因有二。首先,我们有有限的选择数据(平均值=每个观察者在测试阶段完成的4120次试验),自上次上下文切换以来,这些数据在试验数量上分布不均。在我们的实验中,上下文切换的频率创造了大量上下文切换后立即进行的试验,而更少的试验,例如,在单一上下文中进行的第十次试验(图2B,右下角)。像我们对理想观察者所做的那样,对上下文切换后的每个“水平”的试验计数分别估计一致的偏差,会对我们的人类观察者产生不可靠的估计。其次,在感知决策任务中,观察者通常表现出顺序选择依赖性,这可能会被误认为是贝叶斯式的动态推理。具体来说,观察者的反应通常与他们之前的反应相关[17]有时,在之前的刺激下[18]. 这些相关性通常是正的,但也可能是负的。尽管这种依赖关系可以提高时间连续环境中的总体决策准确性,但它们不同于动态贝叶斯推理,后者依赖于对上下文的信念的不断更新。

为了克服这些挑战,我们开发了一种描述性建模方法来描述上下文切换后特定上下文对齐偏差的演变。我们的方法与Roy等人(2021)开发的方法有关[19]描述静态环境中决策策略的时间演变。具体来说,我们使用了一个动态伯努利广义线性模型(GLM),该模型由一组权重定义,这些权重指定了不同任务变量对观察者决策的逐次试验影响。这些变量捕捉刺激和背景操作,以及最近的反应和刺激历史(图6A). 我们的方法在使用动态“偏置函数”方面是新颖的,f(S),它描述了上下文对选择的时间影响,由以下公式给出:

(f)(S公司)=11+e(电子)γS公司C类
(1)

哪里S公司是自上次上下文切换以来的试验次数(对于当前试验),γ控制偏置函数的形状,以及C类是一个分类变量,对于负偏差、一致或正偏差上下文,其值为-1、0或1。我们选择这种函数形式是因为它可以捕捉各种单调发展的关系。对于每个观察者,我们共同估计权重和形状参数γ通过最大化模型下数据的可能性。因为f(S)非线性变化S公司,我们使用两步网格搜索程序来找到此最大值(方法)。

保存图片、插图等的外部文件。对象名称为pcbi.1011104.g006.jpg
基于GLM的人类取向判断策略中交叉试验动力学分析。

(a) 动态GLM。顺时针选择的概率通过六个线性组合回归变量的逻辑变换进行预测。(b) 恢复分析。左:为三个模拟模型观测器绘制的估计历史项作为其地面真值的函数。符号表示平均值;错误条(如果可见)显示了68%的置信区间。右图:自同一模型观察者最近的上下文切换以来,高对比度刺激的对齐偏差随着试验次数的变化而变化。彩色线表示基本真理关系,历史项设置为零,黑色虚线表示平均估计值,阴影区域表示68%的置信区间。(c) 真实线索条件(左)和模糊线索条件(右)受试者的估计历史术语。(d) 在十个相同的对照试验后,模型预测的偏差与真实线索条件(左)和模糊线索条件(右)受试者的上下文切换后立即产生的偏差形成对比。误差条显示了68%的置信区间。(e) 自所有受试者上下文切换以来,低对比度和高对比度刺激的对齐偏差随试验的变化(历史项设置为零的模型预测)。阴影区域显示了68%的置信区间*在交叉验证分析中,动态GLM优于静态GLM(见S1文本). 所有置信区间均根据1000个模拟数据集计算得出。

为了验证我们的方法,我们使用动态GLM为三个模型观测器生成合成数据集。这些模型观测者对任务变量具有相同的权重,但在对过去历史的依赖性以及与上下文切换后的试验次数相一致的偏差的演变方面有所不同。向每个模型观测者展示了向我们的一名人类观测者提供的精确试验序列。然后,我们将我们的分析程序应用于这些合成数据,我们发现它对反应和刺激历史的影响提供了稳健且无偏的估计(图6B,左面板),以及自上次上下文切换以来试验次数的动态影响。通过考虑偏置函数演化的恢复,可以更好地理解后一点(图6B,右侧面板)。我们通过将模型的历史项设置为零来获得此关系,这样:

b(S公司)=w个C类+w个S公司(0.51/(1+e(电子)γS公司))w个θ+w个e(电子)D类e(电子)
(2)

哪里w个C类是上下文的权重,w个S公司偏置函数上的权重,w个θ所述权重指定低对比度下的刺激定向的效果,w个e(电子)重量规定了高对比度下定向的附加效果,以及D类e(电子)一个虚拟变量,低对比度刺激值为0,高对比度刺激为1。如图所示图6B,拟合的GLM非常接近动态偏差的地面真实效果。对于自上次上下文切换以来随着试验次数的增加而快速上升、独立或缓慢下降的模拟校准偏差,情况也是如此。

在验证了我们的方法之后,我们用动态GLM描述了每个人类观察者的选择行为,并使用基于引导的过程来获得模型预测的置信区间(方法)。动态GLM仅比静态SDT模型多了一个自由参数,但对数据的描述要好得多(图B和表AS1文本用于AIC比较)。这一改进部分是由于纳入了历史术语。特别是,我们发现观察者的反应与他们之前的反应有系统的关联(图6C,顶部),但与之前的刺激方案不同(图6C,底部)。此外,动态偏差函数的使用有助于捕捉上下文切换后上下文对感知决策的变化影响。交叉验证分析表明,该模型组件对一些受试者是必要的,但不是所有受试者(参见S1文本). 尽管存在这种异质性,但我们坚定不移地观察到,语境对知觉决策的影响随着在当前语境中花费的时间而增长,超过了先前反应的影响。为了量化这种影响,我们将模型的历史项设置为零,并计算了上下文切换后十次试验的模型预测偏差(等式2)并将该值与模型对上下文切换后立即进行的试验的预测进行了比较。如图所示图6D在同一背景下连续进行10次试验,大多数受试者的对齐偏差增加(高对比度下对齐偏差的中位数增加=0.107度,P=0.005,单侧Wilcoxon符号秩检验,n=12;低对比度=0.155度,P=0.017,n=1)。这种效应在真实线索条件下达到了统计学意义(高对比度=0.147度,P=0.016,n=6;低对比度=0.188度,P=0.016、n=6),但在模糊线索条件下没有达到统计学意义(高对比度=0.094度,P=0.281,n=5;低对比率=0.154度,P=0.078,n=8),可能是由于这种情况下的一致性偏差显著减弱。将历史项设置为零的校准偏差的模型预测交叉试验演变绘制为图6E对这些曲线的检查表明,对于一些受试者来说,在多次试验(CZ、SS、BC)的过程中,校准偏差逐渐增加,而对于其他受试者,偏差突然饱和(AC、CW、DQ),或几乎没有变化(JI、FL、LC)。在真实线索条件下,这种观测者之间的可变性类似于动态贝叶斯理想观测者的变体,对环境的稳定性或上下文线索的可靠性有不同的假设(图3C). 注意,在模糊线索条件下,一些观察者在上下文切换后立即或在上下文中多次试验后表现出负向对齐偏差。虽然贝叶斯理想观测器无法预测这种效果,但我们怀疑它是由测试阶段的低环境稳定性引起的,因为所有模糊线索条件观测器在高度稳定的训练阶段都有正对齐偏差(图4C). 综上所述,这些结果表明,我们的受试者的决定不仅受知觉模糊性和上下文特定先验知识的指导,还受任务层次性和环境稳定性知识的指导。

讨论

感知本质上是不确定的,自然环境不断变化。这两个因素都被认为是影响感官系统计算和表征的主要因素[16,2024]. 这就提出了一个问题,即不确定性和不稳定性如何共同影响感官指导决策[11,25,26]. 我们的分析表明,在一个简单的感知决策任务中,当人们对当前情境的信念更加确定时,他们对情境特定知识的依赖性更强。对于利用环境动态知识的决策者来说,这发生在更稳定的环境中,并且在相同的环境中花费了更多的时间。由此产生的决策偏差可以理解为对动态世界提出的挑战的合理适应。过渡时刻往往会导致潜在背景的不确定性。第一声雷声真的宣布下雨了吗?第一朵花真的意味着春天已经开始了吗?这些问题的答案将影响随后的决定,但由于可用的线索模棱两可,因此不可能始终正确回答它们。最准确的策略是建立并不断更新环境的概率层次表示,以指导对传入刺激的解释。在这种策略下,对当前语境的不确定性削弱了对刺激的强语境特异性先验。当新的证据(雨滴的声音或雪融化的景象)进一步澄清背景时,这些先验因素——及其对感知决策的影响——再次变得更加强大。

我们的研究补充了最近关于动态环境中不确定感知决策的工作。一组研究询问了当刺激-反应应急规则发生隐蔽和不可预测的变化时,负反馈如何影响决策策略,并发现人类和猴子都将预期的选择准确性考虑在内,以消除失败来源的歧义[27,28]. 另一组研究调查了动态刺激在不同时间尺度变化的环境中的时间整合。人类观察员调整他们的决策策略以适应单个试验中突然出现的波动[29],在一系列试验之间[30]或逐步通过长时间的试验[31]. 他们以各种方式这样做,其中包括调整他们对以前信仰的折扣率[29],对最初的信念产生偏见[27],并采用时变决策标准[32]. 这些不同的修改都可以理解为试图改进任务性能,正如最优贝叶斯决策策略所揭示的那样[25].

我们发现,在不断变化的环境中,不确定的感知决策受到特定情境知识的影响,在性质上类似于动态理想贝叶斯策略,但在数量上偏离了这个最佳策略。具体来说,我们报告称,当上下文线索更可靠时,决策偏差更大(图4C,真实与模糊提示条件),当环境更稳定时(图4C,后期vs测试),当感官测量不太确定时(图5B),并且在当前环境中花费了更多时间之后(图6D). 这些影响都是在层次贝叶斯推理策略下预测的(图3B和3C). 然而,我们的分析也揭示了与最优策略的一些定量偏差。最值得注意的是,当上下文线索100%可靠时,在经过良好校准的任务生成模型下,当前上下文不存在不确定性,因此决策偏差既不应依赖于环境的稳定性,也不应依赖自最近一次上下文切换以来的试验次数。这不是我们在真实线索条件下观察到的。此外,当上下文线索的可靠性达到80%时,一个经过良好校准的模型将导致一些决策偏差,即使在高度不稳定的环境中。这不是我们在模糊线索条件的测试阶段所观察到的。第一个近似值是,受试者在这两种条件下的行为都类似于动态贝叶斯推理策略,该策略依赖于任务的一个失调生成模型,在该模型中,上下文线索的可靠性被系统地低估,从而导致弱刺激先验。这种差异的一个可能解释是,受试者可能偶尔会错误地将上下文线索与适当的刺激分布联系起来,从而引入记忆噪声,从而有效地降低了上下文线索的可靠性。受试者也有可能通过对最近的试验求平均值来持续学习上下文特定的刺激分布[26]. 特别是在高度不稳定的环境中,这将导致之前的刺激较弱。正如Sohn和Jazayeri(2021)提出的那样,未来的工作可能能够通过使用先前的成本元模型来区分未校准的生成模型和替代策略[33].

人类使用哪些计算来推断动态环境的统计特性?虽然我们在这项工作中没有解决这个问题,但这是一个活跃的研究领域[26,3438]. 最近几项研究的一个共同发现是,贝叶斯信念更新策略为学习过程提供了合理的解释[26,36,38]. 然而,受试者似乎经常依赖于一个错误校准的任务模型,并且很少排除强化学习等替代策略。尽管如此,这些研究提供了强有力的证据,证明动态环境中的感知决策涉及多个时间尺度上的统计推断:一个快速(针对每个单独的决策),另一个缓慢(针对环境的统计规律)。本研究的主要贡献在于表明,因此,环境动力学的知识可以影响感知决策偏差的大小和时间演变。

人类和其他动物面临的感知推理问题是复杂的,他们用于做出行为选择的策略也是复杂的。规范模型是揭示塑造这些策略的原则的关键工具。这里,贝叶斯推理作为一个框架,用于生成关于哪些形式的知识可以用于改进我们任务中的不确定感知决策的假设。贝叶斯理想观测器模型预测,利用环境中时间结构的代理将使用动态演化的先验过刺激。这一预测很难检验:标准模型过于复杂,无法直接拟合选择数据,但纯基于数据的试验平均方法不够有效,无法从实际数据量中可靠地表征对齐偏差的时间演变。相反,我们选择通过不同建模方法的透镜来观察我们的数据,从而测试标准预测。请注意,我们试图测试的预测并不是人类是否是贝叶斯主义者,而是受规范原则的启发,在动态任务中描述了决策偏差在不同环境中的逐次试验演变。我们使用了一个经过反复试验的决策过程模型来验证波动性和不确定性相关偏差的存在,并使用一个灵活的描述性模型来描述这些偏差在几个试验过程中的动态演变。我们数据的解释主要依赖于每种方法提供的综合见解。因此,我们的研究提供了一个例子,说明如何结合使用不同的计算工具来深入了解单一试验水平下复杂选择行为的机制。

材料和方法

道德声明

实验方案得到了当地伦理委员会(奥斯汀德克萨斯大学机构审查委员会)的批准,所有参与者都给出了书面知情同意书。

行为任务

12名视力正常或矫正至正常的人类受试者(5名男性,7名女性;年龄18-30岁)参与了实验。受试者不知道研究目的。由于样本量大,没有进行性别差异分析。受试者坐在一间光线昏暗的房间里,在一台伽马射线校正的CRT显示器前(Hewlett-Packard,A7217A)。头枕和下巴枕确保参与者的眼睛与显示器屏幕之间的距离为57厘米。眼睛位置通过高速、高精度的眼睛跟踪系统(EyeLink 1000)进行记录。我们以1280 X 1024像素的空间分辨率和75 Hz的刷新率呈现视觉刺激。使用PLDAPS软件呈现刺激(https://github.com/huklab/PLDAPS)在Apple Macintosh计算机上。

受试者在48个试验组中执行定向辨别任务。每次试验都是在参与者注视屏幕中心的一个小正方形(直径0.5°)时开始的。500毫秒后,出现了两个选择目标,一个在固定点的两侧(在水平子午线上,偏心4.5度)。选择目标为白色线条(长2°,宽0.3°),从垂直方向旋转–22.5°(左侧选择目标)和22.5°。500 ms后,出现了一个圆形渐晕漂移光栅。刺激位于左下视觉象限(以3.2°的偏心率为中心),测量直径为1.25°,空间频率为2.5周期/度,时间频率为3周期/秒。受试者判断刺激相对于垂直方向的方向。刺激持续500毫秒。然后,刺激随着注视标记消失,受试者报告了他们的决定,他们用扫视的目光移动到了方向与估计的刺激方向最接近的选择目标。每次试验结束时,都会给出关于反应准确性的听觉反馈。我们在一个小范围(几度)内改变刺激方向,该范围以垂直方向为中心,并根据每个观察者的方向敏感性进行调整。垂直方向的刺激收到随机反馈。刺激以高对比度或低对比度呈现(迈克尔逊对比度为100%和10%)。在12名观察者中,有9名观察者随机交替使用高对比度和低对比度刺激。对于剩下的三名观察者,将高对比度和低对比度刺激分为八组试验。

受试者在三种情境下执行任务,其特征是刺激方向的分布均匀、呈负向倾斜和呈正向倾斜(如图2A). “顺时针”选择正确的相应基线概率分别为50%、70%和30%。上下文切换是伪随机发生的,在培训阶段的危险率为6.3%,在测试阶段为42.5%。固定标记的颜色(红色、绿色或蓝色)在不同的试验中也有所不同。在真实线索条件下,这种颜色表示100%试验的潜在背景,在模糊线索条件下则是80%试验的情况。受试者没有被告知注视标记的颜色。受试者没有在注视标记1.5°范围内保持注视的试验被中止。参与者在三到八个阶段完成了任务,并在实验的测试阶段成功完成了2420到5388次试验。

在执行主要任务之前,受试者参加了一次或多次培训。与主要任务相比,定向范围更大,在这些培训课程中上下文切换的频率更低。我们认为,一旦受试者的刺激判断一致(稳定、合法形成的心理测量功能)、可靠(在容易抓捕的试验中很少失误),并且在最困难的条件下受到环境的适当偏见,他们就可以完成主要任务。这通常需要2000多次培训试验(参见图3A).

动态贝叶斯理想观测器模型

我们推导了贝叶斯理想观测器的预测,该观测器利用其对任务统计结构的知识来最大化决策准确性。动态理想观测者假设在每次试验t中,刺激方向θt吨以及上下文提示x个t吨取决于真正的基础上下文C类t吨每一个上下文都与特定的刺激分布相关第页(θt吨|C类t吨)与行为任务中使用的一个分布相匹配(图2A). 它进一步假设上下文切换发生的概率小时(即危险率),在上下文变量中引入以下转移概率C类t吨:

第页(C类t吨|C类t吨1)={1小时小时/(N个1)C类t吨=C类t吨1C类t吨C类t吨1
(3)

哪里N个=3是可能的上下文数。

在每次试验中,理想的观测器都会获得一个有噪声的方位测量值t吨通过编码分布第页(t吨|θt吨,σ2) =N个(θt吨,σ2),其中σ2是感官噪声的方差。它还可以获得噪声上下文线索测量x个t吨特别是,理想观测者假设上下文线索通过线索生成分布受到外部噪声的干扰第页(x个t吨|C类t吨V(V),κ)=冯·米塞斯(C类t吨,κ),其中C类t吨V(V)是上下文的角度标签C类t吨、和κ是控制上下文提示的假定可靠性的集中参数。这个公式抓住了第一个上下文可能被误认为第三个上下文和副动词的情况,因此代表了记忆噪音。然后,理想的观察者使用这些测量值来更新其关于任务背景和刺激方向的信念,并做出决定。

为了做出决定,理想的观测者估计概率第页(θt吨> 0|t吨,x个t吨)刺激是顺时针方向的。这个估计是基于以下步骤序列的(注意,为了符号的简单性,我们只表示最近的刺激θt吨和提示x个t吨,而不是他们各自的历史θτt吨x个τt吨):

  1. 使用测量的上下文线索更新后验上下文;即计算第页(C类t吨|x个t吨)第页(x个t吨|C类t吨)第页(C类t吨|x个t吨1)
  2. 通过边缘化后验超语境来计算前验超刺激;即计算第页(C类t吨|x个t吨)C类t吨第页(x个t吨|C类t吨)第页(C类t吨|x个t吨1)
  3. 使用得到的先验值计算后超刺激方向θt吨给出了噪声表示t吨; 即计算第页(θt吨|t吨,x个t吨)
  4. 使用得到的后验值计算刺激顺时针方向的概率;即计算第页(θt吨>0|t吨,x个t吨)=θt吨>0第页(θt吨|t吨,x个t吨)
  5. 如果第页(θt吨>0|t吨,x个t吨)>0.5,响应方向为顺时针;如果第页<0.5,逆时针响应;如果第页=0.5,随机响应。
  6. 计算下一时间步的先验上下文;即计算第页(C类t吨+1|x个t吨)=C类t吨第页(C类t吨|x个t吨)第页(C类t吨+1|C类t吨)

为了说明这种理想观测器利用的不同形式的知识的有用性,我们还模拟了三种无法访问特定任务组件知识的模型变体的任务性能(图2C). 所有模型变体都采用了相同的一组刺激和线索测量,模拟了实验训练阶段的时间动态。在我们的实现中,所有模型变量都遵循相同的决策步骤顺序,但它们对生成过程的假设不同。例如,模型1对感知的模糊性有一般了解,但对对比的影响没有了解。我们将其实现为假设一个单一水平的刺激无关的感觉噪声,该噪声总结了实验中方向测量的整体可变性(步骤3)。模型1不知道特定情境的刺激分布。我们实现了这一点,将每个上下文线索与总结任务中整体刺激分布的相同均匀分布关联起来(步骤2)。最后,模型1不了解环境变化的可能性。我们实现这一点的前提是假设每个试验的先验水平高于上下文(步骤6)。我们使用这种方法来指定每个模型变量。对于生成过程,我们在该模拟中使用了以下参数值:方向=[-7.5,-5,-2.5,0,2.5,5,7.5],σ2高对比度刺激=10,低对比度刺激=20,h=20%,κ=1.5。

为了识别最优决策策略的特征,我们模拟了动态贝叶斯理想观测器模型的选择行为,模拟了实验测试阶段的时间动态。我们考虑了理想观察者的任务生成模型可能会被错误校准的两种方式:假设的风险率或上下文线索的假设可靠性(或两者)可能与行为实验中使用的实际值不同(图3C). 我们在模拟中使用了以下参数值:方向=[-7.5,-5,-2.5,0,2.5,5,7.5],σ2=高对比度刺激2,低对比度刺激5,小时=10、20和50%,κ=0.4、0.2和0.025图2E和图A的0.45、0.4和0.35S1文本每个模拟实验包括57600000次试验。

信号检测理论模型

我们通过用基于信号检测理论的决策过程模型拟合任务变量(方向、对比度和上下文)与“顺时针”选择概率之间的关系,测量了观察者对刺激方向的不确定性及其估计偏差[39]. 在这个模型下,每次试验都会产生一个方向估计,并与一个固定的标准进行比较,以获得一个决策(图4B). 我们假设这些估计遵循高斯分布,其平均值由真实刺激方向加上上下文特定常数确定(产生两个自由参数:一个用于均匀上下文,另一个用于非均匀上下文)。高斯分布由刺激的对比度决定(产生两个自由参数)。最后,我们假设在一些试验中,观察者“失误”,只是猜测而不考虑任务变量[40](两个自由参数,每个对比度一个)。我们根据模型比较分析选择了该模型,在该分析中,我们根据实验测试阶段收集的数据评估了该模型的四个版本(对高对比度和低对比度选择数据分别进行了10000倍的分离交叉验证分析)。模型版本在用于描述方位估计的上下文特定偏移和扩展的自由参数数量上有所不同(见中的表B和表CS1文本). 假设响应来自伯努利过程,通过最大化观测数据的可能性来优化模型参数。通过执行1000倍的非参数自举,我们获得了不确定性和偏差估计的置信区间。

动态伯努利广义线性模型

我们通过拟合一个描述性模型来表征受试者决策策略的时间演变,该模型规定了一组独立操纵的任务变量(定向、对比和上下文)以及两个历史术语(先前反应、先前定向)的逐个试验的影响以及自上下文切换以来的非线性转换试验对选择行为的影响。这些预测因子线性组合,然后通过logit链接函数传递。logit链接函数由下式给出

o(o)t吨(Φ)=n个(Φ1Φ)
(4)

哪里ϕ是顺时针选择的概率。因此,主观等式点PSE可以通过将预测值的线性组合设为零并求解S公司,自上次上下文切换以来的试验次数。当历史项被设置为零时,这对于高对比度条件产生以下表达式:

P(P)S公司E类(S公司,C类)=(w个cC类+w个(f)(S公司)+w个α)w个θ+w个e(电子)
(5)

哪里w个C类是上下文的权重,C类指示上下文(-1、0或1),w个S公司是偏置函数的权重f(S),w个α加性常数,w个θ指定低对比度刺激方向效果的权重,以及w个e(电子)指定高对比度下定向的附加效果的权重。计算等式5对于顺时针和均匀条件等式2.

假设响应来自伯努利过程,通过最大化观测数据的可能性来优化模型参数。我们使用了两步“网格搜索”程序来找到这个最大值,我们首先针对给定的γ值优化所有模型参数,针对手动指定的γ值范围重复此搜索过程,然后选择具有最佳fit值的解决方案。对于每个受试者,动态GLM比信号检测理论模型更好地捕获数据(Akaike信息标准比较,请参见中的表A和图AS1文本). 为了评估动态偏差函数的必要性,我们进行了交叉验证分析,其中上下文切换后1到4次试验之间的试验包括训练集,以及上下文切换后第5次或更晚的试验组成测试集。在六分之四的真实线索条件观测器和六分之三的模糊线索条件观察器中,全动态GLM优于缺乏动态偏置函数的简化“静态”版本(见S1文本).

支持信息

S1文本

图A.贝叶斯理想观测者对齐偏差的决定因素。

(a) 自最近的上下文切换(列)和相同上下文试验的数量以来,低对照对齐偏差(颜色)作为试验的函数先前的假设风险率为10%,上下文线索可靠性水平较低,则发送到最近的上下文开关(行)。(b) 在一系列假设的风险率和上下文线索可靠性水平上的一致偏差模式。图B。动态GLM和信号检测理论模型的拟合优度比较。低对比度数据显示为开放符号,高对比度数据则显示为填充符号。表A。AIC根据信号检测理论模型和动态GLM对实验测试阶段收集的选择数据进行估计。表B。在信号检测理论模型的四种不同变体下预测的保持数据的平均对数似然(仅包括高对比度试验)。表C。在信号检测理论模型的四种不同变体下预测的保持数据的平均对数似然(仅包括低对比度试验)。表D。表中的每个单元格报告每个受试者的搁置数据的总对数似然。最右边的一列表示每个受试者的总数据中搁置部分所占的比例。

(文档)

致谢

作者感谢Corey Ziemba和Zoe Boundy-Singer的宝贵讨论和反馈。

资金筹措表

这项工作得到了美国国立卫生研究院拨款T32 EY021462(J.A.C.)、国家眼科研究所EY032999(R.L.T.G.)、国家科学基金会CAREER奖#2146369(R.L.T.G.)和欧盟地平线2020研究与创新计划(根据Marie Skłodowska-Curie拨款协议第754411号(W.F.M.))的支持,霍华德·休斯医学研究所(A.M.H.)。资助者在研究设计、数据收集和分析、决定出版或编写手稿方面没有任何作用。

数据可用性

链接到开放科学框架(OSF)的数据和代码:https://osf.io/v7ecy/.

工具书类

1Dong DW,Atick JJ。自然时变图像的统计.网络:神经系统中的计算.1995;6():345–358.[谷歌学者]
2刀具D,Pouget A。贝叶斯大脑:不确定性在神经编码和计算中的作用.神经科学趋势. 2004;27(12):712–9. doi:10.1016/j.tin.2004.10.007[公共医学] [交叉参考][谷歌学者]
三。Geisler WS、Perry JS、Super BJ、Gallogly DP。自然图像中的边缘共生预测轮廓分组性能.视觉研究. 2001;41(6):711–724. doi:10.1016/s0042-6989(00)00277-7[公共医学] [交叉参考][谷歌学者]
4Weiss Y、Simoncelli EP、Adelson EH。作为最佳知觉的运动错觉.自然神经科学. 2002;5:598–604. doi:10.1038/nn0602-858[公共医学] [交叉参考][谷歌学者]
5Brainard DH、Longère P、Delahunt PB、Freeman WT、Kraft JM、Xiao B。人类颜色恒常性的贝叶斯模型。 J维斯. 2006;6(11):1267–1281. 电话:10.1167/6.11.10[PMC免费文章][公共医学] [交叉参考][谷歌学者]
6Tomassini A、Morgan MJ、Solomon JA。方向不确定性降低了感知的倾角.视觉研究. 2010;50(5):541–547. doi:10.1016/j.visres.2009.12.005[公共医学] [交叉参考][谷歌学者]
7Adams WJ、Graf EW、Ernst MO。经验可以改变先前的“上光”。 自然神经科学. 2004;7:1057–1058. doi:10.1038/nn1312[公共医学] [交叉参考][谷歌学者]
8刀DC。学习深度感知的贝叶斯先验知识。 J视觉。2007;7(8):13. 数字对象标识代码:10.1167/7.8.13[公共医学] [交叉参考][谷歌学者]
9Hanks TD、Mazurek ME、Kiani R、Hopp E、Shadlen MN。经过的决策时间影响感知决策任务中先验概率的权重.神经科学. 2011;31(17):6339–52. doi:10.1523/JNEUROSCI.5613-10.2011[PMC免费文章][公共医学] [交叉参考][谷歌学者]
10DeWeese MR,Zador AM。最优方差适应中的非对称动力学。 神经计算. 1998;10(5):1179–1202.[谷歌学者]
11Młynarski WF,Hermundstad AM。动态感官推理的自适应编码。 电子生活. 2018;7:e32055.doi:10.7554/eLife.32055[PMC免费文章][公共医学] [交叉参考][谷歌学者]
12冯·赫尔姆霍兹H。Handbuch der physologischen Optik,第三卷,利奥波德·沃斯;1867[谷歌学者]
13Orban GA、Vandenbussche E、Vogels R。用长刺激测试人的方向辨别力.视觉研究. 1984;24(2):121–128. doi:10.1016/0042-6989(84)90097-x[公共医学] [交叉参考][谷歌学者]
14Goris RLT、Ziemba CM、Stine GM、Simoncelli EP、Movshon JA。猕猴视皮层选择形成与选择相关活动的分离.神经科学. 2017;37(20):5195–5203. doi:10.1523/JNEUROSCI.3331-16.2017[PMC免费文章][公共医学] [交叉参考][谷歌学者]
15Mareschal I,Shapley RM。对比度和大小对方向辨别的影响.视觉研究. 2004;44(1):57–67. doi:10.1016/j.visres.2003.07.009[公共医学] [交叉参考][谷歌学者]
16Hénaff OJ、Boundy-Singer Z、Meding K、Ziemba CM、Goris RLT。通过神经增益可变性表示视觉不确定性。 国家公社。2020;11:2513.doi:10.1038/s41467-020-15533-0[PMC免费文章][公共医学] [交叉参考][谷歌学者]
17Fruend I、Wichmann FA、Macke JH。量化审判间依赖对感知决策的影响。 J视觉。2014;14(7):9. doi:10.1167/14.7.9[公共医学] [交叉参考][谷歌学者]
18Fisher J,Whitney D。视觉感知中的序列依赖.自然神经科学. 2014;11:738–43.[PMC免费文章][公共医学][谷歌学者]
19Roy NA、Bak JH、Akrami A、Brody CD、Pillow JW。提取感官决策实验中的行为动力学.神经元. 2021;109(4):597–610. doi:10.1016/j.neuron.2020.12.004[PMC免费文章][公共医学] [交叉参考][谷歌学者]
20.Jazayeri M,日本莫夫松。神经群体对感官信息的最优表示.自然神经科学. 2006;9(5):690–6. [公共医学][谷歌学者]
21Orbán G、Berkes P、Fiser J、Lengyel M。视觉皮层的神经可变性和基于抽样的概率表征.神经元. 2016;92(2):530–543. doi:10.1016/j.neuron.2016.09.038[PMC免费文章][公共医学] [交叉参考][谷歌学者]
22Fairhall AL、Lewen GD、Bialek W、de Ruytervan Stevenick RR。自适应神经代码的效率和模糊性.自然. 2001;412:787–792. doi:10.1038/35090500[公共医学] [交叉参考][谷歌学者]
23Hénaff OJ、Goris RLT、Simoncelli EP。自然视频的感知矫正.自然神经科学. 2019;22(6):984–991. doi:10.1038/s41593-019-0377-4[公共医学] [交叉参考][谷歌学者]
24Hénaff OJ、Bai YH、Charlton JA、Nauhaus I、Simoncelli EP、Goris RLT。初级视觉皮层拉直自然的视频轨迹。 国家公社. 2021;12(1):5982. doi:10.1038/s41467-021-25939-z[PMC免费文章][公共医学] [交叉参考][谷歌学者]
25Kilpatrick ZP、Holmes WR、Eissa TL、JosićK。动态环境下的决策优化模型.Curr Opin神经生理学. 2019;58:54–60. doi:10.1016/j.cb.2019.06.006[PMC免费文章][公共医学] [交叉参考][谷歌学者]
26Norton EH、Acerbi L、Ma WJ、Landy MS。人类对先验概率变化的在线适应。公共科学图书馆计算生物学. 2019;15(7):e1006681。[PMC免费文章][公共医学][谷歌学者]
27Purcell BA,Kiani R。在不同的时间范围内运行的分层决策过程是战略选择和变更的基础.美国国家科学院院刊. 2016;113:E4531–E4540。doi:10.1073/pnas.1524685113[PMC免费文章][公共医学] [交叉参考][谷歌学者]
28Sarafyazd M、Jazaeri M。额叶皮层神经回路的层次推理.科学类. 2019;364:eaav8911.doi:10.1126/science.aav8911[公共医学] [交叉参考][谷歌学者]
29釉面CM、Kable JW、Gold JI。在不可预测的环境中积累规范的证据。 电子生活. 2015;4:e08825.doi:10.7554/eLife.08825[PMC免费文章][公共医学] [交叉参考][谷歌学者]
30Kim TD、Kabir M、Gold JI。耦合的决策过程在动态环境中更新和维护扫视先验信息.神经科学. 2017;37(13):3632–3645. doi:10.1523/JNEUROSCI.3078-16.2017[PMC免费文章][公共医学] [交叉参考][谷歌学者]
31Yu AJ、Cohen JD。顺序效应:迷信还是理性行为? 高级神经信息处理系统. 2008;21:1873–1880.[PMC免费文章][公共医学][谷歌学者]
32Zhang S、Lee MD、Vandekerckhove J、Maris G、Wagenmakers EJ。决策和响应时间扩散模型的时间-变量边界。 前心理医生. 2014;5:1364.doi:10.3389/fpsyg.2014.01364[PMC免费文章][公共医学] [交叉参考][谷歌学者]
33.Sohn H、Jazayeri M。使用先验元分析验证基于模型的贝叶斯集成.美国国家科学院院刊. 2021;118(25)e2021531118。doi:10.1073/pnas.2021531118[PMC免费文章][公共医学] [交叉参考][谷歌学者]
34Nassar MR、Wilson RC、Heasly B、Gold JI。一个近似贝叶斯增量规则模型解释了变化环境中信念更新的动态性.神经科学. 2010;30(37):12366–12378. doi:10.1523/JNEUROSCI.0822-10.2010[PMC免费文章][公共医学] [交叉参考][谷歌学者]
35Radillo AE、Veliz-Cuba A、JosićK、Kilpatrick ZP。动态环境中的证据积累和变化率推断。 神经计算. 2017;29(6):1561–1610. doi:10.1162/NECO_a_00957[公共医学] [交叉参考][谷歌学者]
36Glaze CM、Filipowicz ALS、Kable JW、Balasubramanian V、Gold JI。在不可预测的环境中,偏差-方差权衡控制在线学习中的个体差异。 Nat Hum Behav公司. 2018;2():213–224.[谷歌学者]
37Lee S、Gold JI、Kable JW。人类作为增量规则学习者。 决定。2020;7(1):55–66.[谷歌学者]
38Zylberberg A,Wolpert DM,明尼苏达州Shadlen。反事实推理是学习决策先验知识的基础.神经元. 2018;99(5):1083–1097. doi:10.1016/j.neuron.2018.07.035[PMC免费文章][公共医学] [交叉参考][谷歌学者]
39Tanner WP,Swets JA公司。视觉检测的决策理论。 精神病Rev. 1954;61:401–409. doi:10.1037/h0058700[公共医学] [交叉参考][谷歌学者]
40新泽西州希尔市Wichmann FA。心理测量功能:I.拟合、抽样和拟合优度.感知心理。2001;63(8):1293–1313. doi:10.3758/bf03194544[公共医学] [交叉参考][谷歌学者]

文章来自PLOS计算生物学由以下人员提供多环芳烃