Striatal circuits for reward learning and decision-making

Julia Cox; Ilana B. Witten

doi:10.1038/s41583-019-0189-2

Nat Rev神经科学。作者手稿；PMC 2020年5月17日提供。

以最终编辑形式发布为：

国家神经科学评论。2019年8月；20(8): 482–494.

数字对象标识：10.1038/s41583-019-0189-2

预防性维修识别码：PMC7231228号

美国国立卫生研究院：美国国立卫生研究院1580784

PMID：31171839

奖励学习和决策的纹状体电路

朱莉娅·考克斯¹和伊拉娜·维滕^1,^2,^*

作者信息版权和许可信息 PMC免责声明

摘要

纹状体对于学习哪些行为导致奖励以及执行这些行为至关重要。几十年的实验和理论工作导致了一些关于纹状体电路如何介导这些功能的有影响力的理论和假设。然而，由于技术限制，严格测试这些假设是困难的。在这篇综述中，我们简要介绍了纹状体功能的一些经典概念。然后，我们回顾了最近在啮齿动物身上进行的研究，这些啮齿动物利用光学和遗传学方法，通过记录和操纵电路中确定的细胞类型来测试这些经典想法。这项新的研究为纹状体电路的一些长期观点提供了实验支持，并揭示了经典观点中不正确或不完整的关键方面。

决策包括根据外部信息（例如感官输入）和内部信息（例如奖励历史）选择运动计划。在这里，我们考虑纹状体在基于感官和价值观的决策中的作用，以及在学习这些行为背后的奖励关联中的作用。

纹状体是基底神经节的主要输入核，位于多个平行的皮质-亚皮质环内。它接收来自皮层和丘脑的输入，并发送输出，最终通过丘脑将信息传递回皮层^1–三此外，纹状体是许多脑区谷氨酸能输入与中脑多巴胺（DA）神经元密集神经支配汇合的部位⁴因此，纹状体在学习和决策中发挥着至关重要的作用。

纹状体本身主要由称为中棘神经元（MSN）的GABA能投射神经元组成，它们被分为两个分子上不同的群体，通过基底神经节的输出投射通路基本上是分开的^5–9这两条通路相反地调节基底节的输出结构，基底节具有较高的基线放电率，并对丘脑和脑干核团具有张力抑制作用^10–15除MSN外，纹状体中还有少量中间神经元，包括胆碱能中间神经元（CIN）¹⁶以及多个其他GABA能神经元亚类，可以根据其生理和分子特征进行区分^17–19.

在这篇综述中，我们讨论了最近关于纹状体中特定细胞类型及其输入如何参与学习和决策的工作。我们关注五种细胞类型：多巴胺能输入神经元、两类MSN、CIN和谷氨酸能输入神经元（GABA能中间神经元已在其他方面进行了综述^18,19). 对于纹状体回路的每个组成部分，我们简要回顾了有关它们在学习和决策中的作用的经典观点，这些观点主要来源于解剖、电生理和药理学实验。然后，我们讨论了过去十年的研究，这些研究使用遗传和光学工具来更精确地监测和操纵啮齿动物纹状体回路中这些不同的细胞类型。在某些情况下，这项工作证实了关于这些细胞类型在学习和决策中的作用的经典观点，而在其他情况下，最近的研究表明经典观点是不完整的，这为该领域现在必须解决的新问题开辟了道路。

中脑多巴胺神经元

教学信号。

起源于腹侧被盖区（VTA）和黑质致密部（SNc）的DA神经元为纹状体提供密集的局部神经支配^20–26(图1a). VTA优先投射到伏隔核（NAc），而SNc则优先投射到纹状体背内侧（DMS）、背外侧（DLS）和纹状体尾部（TS；参见方框1纹状体亚区介绍）。精液实验表明，这些DA神经元编码奖赏预测误差（RPE），即经验奖赏和期望奖赏之间的差异^27,28这一结果已在多种物种（包括小鼠、大鼠和非人类灵长类）中得到证实，并在推测DA神经元的放电模式和纹状体中DA浓度的变化中观察到^29–37.

保存图片、插图等的外部文件。对象名为nihms-1580784-f0001.jpg

在单独的窗口中打开

图1|

中脑多巴胺神经元的异质性。

一|黑质致密部（SNc）和腹侧被盖区（VTA）向纹状体的投射组织示意图。VTA主要投射到腹侧纹状体，SNc投射到背侧纹状体内^20–26侧SNc中不同的多巴胺（DA）神经元群投射到纹状体（TS）的尾部²⁰³.b条|DA神经元及其在SNc和VTA中的组织的异质性活动模式的示意图示例。在VTA和SNc神经元中发现奖励预测错误信号^25,36,58.DA神经元对预测奖赏的意外奖赏（左侧）或线索（如听觉音调）都会增加活动。在内侧VTA中，一些DA神经元表示试验的准确性⁵⁸其他VTA神经元的活动与动物与奖赏的距离相关^58,204侧VTA和SNc中一些DA神经元的活动与运动有关^58,59,63,64纹状体中一些SNc-DA轴突的活动与显著性比与价值更相关，因为它们对意外的积极事件（例如水奖励）和消极事件（例如脚部休克）的反应类似²³外侧SNc的神经元对奖赏反应较弱，对显著或威胁性刺激（如吹气）反应更强烈^60,61DLS，纹状体背外侧；DMS，背内侧纹状体；伏隔核核；NAcsh，伏隔核外壳。

方框1|

纹状体的功能分区

纹状体被分为多个功能亚区，这些功能亚区被认为是调节不同类型联想的学习和表达的中介。在啮齿类动物中，这些区域包括背外侧纹状体（DLS；与灵长类壳核同源）、背内侧纹状体（DMS；与灵长类尾状体同源）和腹侧纹状体（VS）。这些通常分别被定义为感觉运动纹状体、联想纹状体和边缘纹状体^{三,57,187–190}.

DLS被认为对形成刺激-反应关联很重要，这些关联是熟练动作和习惯性动作的基础^{三,188,190–196}而DMS则调节依赖于反应-结果关联的目标导向行为^{三,57,188,190,193–195,197}如果相关结果不再有价值，动物将停止执行目标导向的行动。相比之下，习惯行为对相关结果的价值相对不敏感。DMS的损伤或失活使学习的操作行为习惯化，而DLS的损伤和失活则阻止行为习惯化^57,191这些结构在学习过程中都是活跃的，但过度训练作为一种动作，在这些结构中形成了从目标导向到习惯性、独特的活动模式的过渡^193,194.

伏隔核（NAc；VS的主要组成部分）被认为参与了结果评估和动机，以及对巴甫洛夫学习很重要的刺激-结果关联的形成^{188,190,198,199}此外，通过其向中脑多巴胺神经元的大量投射^200,201NAc调节纹状体多巴胺的释放²⁰².

最后，在灵长类动物中，纹状体尾部（TS）越来越被认为是一个独特的亚区，参与处理感觉信息和促进依赖感觉信息的行为^177–180虽然研究较少，但一些证据表明啮齿动物的TS也专门用于感知信息^{88,152,158,176}.背侧纹状体可能可以进一步细分^147,148但这些精细部门的职能作用尚待探讨。

多巴胺能RPE信号是纹状体强化学习的关键功能之一。RPE被认为是一种增强信号，可以改变纹状体谷氨酸能突触的输入，而纹状体在意外奖赏期间是活跃的（即与DA神经元共同活动）。因此，这些突触的DA-依赖性可塑性提供了一种突触机制，通过这种机制，与意外奖励相关的动作更有可能被重复，或与意外奖励有关的刺激更有可能被追求^38–42.

操纵DA活动的经典实验支持DA作为教学信号支持强化学习的观点。例如，自20世纪50年代以来，人们就知道动物会执行任意动作来接受内侧前脑束的电刺激^43,44多巴胺能拮抗剂可以减弱这种作用^45,46.

多巴胺系统异质性的新证据。

近年来，DA活动支持强化学习的经典观点已经在广泛的学习范式中通过光遗传学激活或抑制DA神经元进行了直接测试。这些研究具有细胞类型特异性和时间精确性，可以直接验证DA神经元提供RPE信号支持强化学习的假设。他们已经明确证实DA神经元的激活支持巴甫洛夫学习^25,47,48，上下文学习^49,50和操作性学习^50–53相反，对这些神经元的短暂光遗传抑制模拟了一个负预测错误：抑制DA神经元会促进先前条件反射的消失⁵⁴，诱导条件性场所回避⁵⁰减少动物重复先前选择动作的可能性^52,55.

考虑到纹状体的解剖和功能特化(方框1)根据纹状体靶区的功能，该RPE信号可能支持不同形式的学习。与此相一致的是，刺激纹状体的VTA DA投射或SNc DA投射足以将中性线索转变为条件刺激，但有重要区别²⁵激活从VTA到NAc的投射，诱导线索接近，并导致线索自身增强。相比之下，激活SNc向背侧纹状体的投射会引起强烈但无定向的运动，以响应提示，并且不会导致提示增强²⁵这种区别与纹状体亚区的经典观点一致：NAc被认为对产生刺激-结果关联很重要，而背纹状体被认为对刺激-反应关联和行动-结果关联更重要^56,57(方框1).

虽然最近的光遗传学实验支持了DA活动作为RPE来驱动强化学习的经典观点，但从已识别的DA神经元的体内记录已经揭示了RPE信号³⁶，许多其他完全出乎意料的反应模式在体内被记录下来，在RPE框架内无法轻易解释^58–61(图1b). 这些发现挑战了DA投射到纹状体均匀传输RPE信号的经典观点，转而指向DA系统内的解剖特化，并提出了关于这些非RPE信号可能起到什么作用的新问题。

值得注意的是，DA神经元活动的专门化似乎与它们的位置或投射在纹状体的位置有关。例如，背侧纹状体的DA神经元末端具有相对较弱的奖赏反应，但在运动过程中反应强烈⁵⁹或对侧运动^55,62类似地，SNc中的单个DA神经元在运动开始时会增加其活动，这种活动的增加与这些运动的活力相关⁶³(图1b). 与这些神经相关性一致，光遗传学刺激DMS中的SNc细胞体或其末端会增加运动^59,63,64而它们的失活会减少动作的启动，并降低确实发生的动作的活力⁶³.

DA活动的另一个方面似乎与RPE不一致，这是一些推测的DA神经元，特别是SNc对厌恶事件的积极反应^{23,60,65–67}对已确定的DA神经元进行钙成像也表明，这些对厌恶的反应是投射特异性的，类似于运动相关的活动增加。特别是，DLS投射的SNc-DA神经元对脚部电击反应增强²³而TS-投射的SNc-DA神经元对吹气的反应增强⁶⁰(图1b). TS-投射DA神经元的视基因激活增强了回避行为⁶⁰这表明，即使是不编码RPE的DA神经元也支持特定形式的强化学习。

鉴于越来越多的人认识到DA信号不易被视为与RPE相关，一个重要的问题是RPE和非RPE信号是如何跨单个DA神经元组织的。在小鼠在虚拟迷宫中进行决策任务的VTA中，DA神经元表现出惊人的异质性活动，大多数单个神经元代表一个或两个特定的行为变量，例如奖励历史、试验准确性、运动学和/或空间位置(图1b). VTA内具有类似活动特征的DA神经元更有可能在空间上定位⁵⁸虽然RPE并没有明确解释在这项任务中观察到的这些变量的异质性和专门选择性，但编码特定行为变量的许多相同神经元也编码RPE⁵⁸.

与在VTA中相同神经元内观察到的RPE和非RPE反应的重叠相反，由奖赏激活的SNc中的DA神经元似乎与运动开始时激活的DA神经元有很大不同^59,63这一观察结果表明，与VTA相比，RPE信号在SNc中并不普遍。

直接和间接输出途径

促进和压制行动。

在背侧纹状体，直接通路的MSN表达D₁多巴胺受体（D1R），并抑制基底神经节的主要输出核——内部苍白球（GPi）和黑质网状部（SNr）。相比之下，间接途径MSN表达D₂多巴胺受体（D2R）和间接增加基底节输出^7,8,68(图2a). 这两条通路功能的经典观点是，它们通过相反地调节基底节输出核的放电速率来区别调节行为^{2,10,12,13,15}例如，直接通路的激活将导致脑干运动结构以及以运动皮层为靶点的丘脑核团的去抑制，从而促进运动。间接途径驱动基底节输出核的进一步激活，从而促进对其靶点的抑制，抑制运动^{2,10,12,13,69–72}该提案通常被称为“执行/不执行”模型。

保存图片、插图等的外部文件。对象名为nihms-1580784-f0002.jpg

在单独的窗口中打开

图2|

行为的直接和间接途径调节。

一|通过基底神经节的直接和间接通路的简化示意图。直接途径和间接途径功能的“go/no-go”模型提出，当D₁构成直接通路的多巴胺受体（D1R）中棘神经元（MSN）被激活（左），它们抑制基底神经节的初级输出核：苍白球（GPi）和网状黑质（SNr）。GPi和SNr能抑制脑干和丘脑核团，这些核团通过D1R MSN激活而被解除抑制。当多巴胺D₂间接通路的受体（D2R）MSN被激活（右），它们抑制外侧苍白球（GPe），后者向GPi、SNr和丘脑底核（STN）发送抑制性投射。因此，GPi、SNr和STN被去抑制。STN向GPi和SNr发送兴奋性输入，进一步激活并抑制其脑干和丘脑靶点^{2,10,12,13,69,72,205}.b条|细胞类型特异性细胞外记录的示意数据⁹⁰D1R和D2R神经元在所选动作中具有相似的激活模式和选择性，但对结果的编码相反。c|在决策任务中，D1R或D2R MSN的光基因刺激会产生相反的偏差，这些偏差取决于两个选项之间的动作值差异（动作结果的估计值）。零件b条经reF许可进行改编。⁹⁰爱思唯尔。零件c改编自reF。¹⁰²Springer Nature有限公司。

在其最简单的形式中，go/no-go模型提出了一个简单的假设，即每个通路代表什么信息：D1R神经元在动作过程中会活跃（因为它们促进它们），而D2R神经元在行动过程中会不活跃（因为他们抑制它们）。一项相关建议建议，D1R MSN编码选定的行为，而D2R MSN则编码未选定的行为^13,69.

go/no-go模型可以扩展到学习和决策，这两种途径对这些过程施加相反的控制。例如，纹状体区域，如DMS或VS，接收来自前额叶皮层的输入，可能会对基于价值的决策产生相反的影响，而TS等次区域，接收来自感觉皮质的输入，则可能会对感知决策产生相反影响。然而，迄今为止，大多数研究主要考察了自发运动背景下的go/no-go模型，其中控制这些运动的学习和决策变量没有明确控制。为了完整起见，并且由于对自发运动的研究可以提供对这些解剖路径如何在决策环境中控制运动的见解，我们在下面回顾了对自发运动和决策的研究。

尽管活动模式相似，但效果相反。

虽然纹状体MSN的电生理记录揭示了感觉刺激、运动和价值的神经相关性^73–76这些研究无法区分D1R和D2R MSN，因此很难测试go/no-go模型的预测。靶向D1R和D2R MSN的转基因小鼠系的建立^77,78已经能够独立地识别和操纵这两个群体，以评估关于其内源性活动的假设。

虽然经典的go/no-go模型可以预测运动过程中两条路径中相反的活动模式，但令人惊讶的是，来自背侧纹状体两种MSN的记录却显示出非常相似的活动模式。例如，这两条路径在运动中比静止时更为活跃^79–85，在训练期间同样活跃^79,86–91和自发运动^80–84，编码动物的速度^80–83在对侧运动中优先活跃^79,91,92这些数据表明，直接和间接路径同时协调运动；事实上，这两条途径之间有相当大的沟通^7,9,17,70,93因此，直接与间接通路功能的简单go/no-go模型可能不完整。

尽管这些数据与go/no-go模型的最简单解释相矛盾，但它们可以解释为直接途径促进所选动作，而间接途径抑制替代动作^13,69,79这一解释引发了一个有趣且可测试的预测，即直接通路神经元比间接通路神经元对动作更具选择性，因为在任何时间点，未选择的动作都远多于选择的动作。测试这个模型需要检查可以分析两个以上动作的神经相关性的行为，这在大多数关于自发运动的研究中都不是这样，据我们所知，在决策任务中根本没有实现。然而，最近对自发行为的研究表明，机器学习算法将运动分为多个离散成分，这种模型可能也不完整^81,82这些详细的分析表明，这两个种群同时编码自发行为^81,82在两条途径中具有相似程度的特异性^81,83这种特异性的相似性表明，D2R MSN的集合不太可能在特定环境中抑制所有未选择的动作。因此，到目前为止，数据并不明确支持go/no-go模型的扩展，在该模型中，间接途径比直接途径抑制更广泛的作用。因此，需要新的思路来解释这两种途径的功能。

另一种可能性是，尽管D1R和D2R MSN在同一动作中都是活跃的，但这两种途径的相对激活决定了该动作是被选择还是被避免^94–96一个潜在的相关观点是纹状体参与了作为运动输出基础的学习或决策过程，但不直接参与产生运动输出。在这个框架中，D1R和D2R MSN可能对运动输出下的决策变量有相反的表示，尽管在运动期间有类似的激活^82,97当与决策相关的内部变量（例如，行为的价值或驱动决策的感官证据）时，可以最好地测试这种可能性⁹⁸)在决策过程中受参数控制，但在自发行为期间不受参数控制。

为了支持这些观点，最近的证据表明，价值可能会相反地调节这两种途径的活动，尽管这两种途径在运动过程中表现出相似的活动^90,91,99例如，在基于价值的决策任务中，许多D1R MSN在奖励呈现期间增加了活动⁹⁰而D2R MSN在无回报的结果中更为活跃^90,100(图2b). 在巴甫洛夫条件反射任务中也观察到相反的结果依赖性反应；这里，D1R和D2R MSN对奖励线索的反应分别与奖励价值呈正相关或负相关⁹⁹D1R和D2R MSN的活动似乎受值的不同调节，这一事实表明，这些神经元可能对行为决策的内部变量进行相反的编码，而不是对行为本身进行编码。

D1R或D2R MSN的特定光遗传操作进一步支持了这样的观点，即D1R MSN和D2R MSNs相反地调节决策，而不是影响运动输出(图2c). 接受概率反转学习任务训练的动物如果能够获得奖励，则倾向于重复先前选择的动作，如果没有，则会切换^90,101,102在小鼠执行其选择的动作之前短暂刺激D1R MSN或D2R MSN，分别诱导对侧或同侧偏倚。这不仅仅是一种运动效应，因为偏差取决于两个可用选项的估计值的差异，因此当两个选项的估计价值更接近时，偏差更大¹⁰²(图2c). 此外，在结果呈现期间刺激D1R MSN会减少奖赏后的转换，而刺激D2R MSN则会增加未奖赏试验后的转换。这表明这些途径中的结果期活动调节了动物的结果依赖性决策策略⁹⁰.

直接和间接途径的激活似乎也相反地调节学习。背侧纹状体中D1R MSN的激活增强了与刺激相关的行为或空间位置¹⁰³并能强化训练动作的特定特征，如速度¹⁰⁴.D2R MSN激活具有相反的效果：降低刺激配对行为的表现，诱导对空间位置的厌恶，减少对特定运动速度的选择^103,104同样，刺激NAc中的D1R MSN会增加可卡因条件性位置偏爱（CPP），而刺激D2R MSN则会降低可卡因CPP¹⁰⁵.

因此，来自视基因激活的大量支持表明，D1R和D2R神经元对学习和决策施加拮抗控制。然而，最近的研究也表明，间接途径具有令人惊讶的功能，这似乎与“不去”完全不同。例如，在感官go/no-go任务中，D1R MSN或D2R MSN的激活会导致对go反应的偏见，而感官信息的感知没有改变¹⁰⁶D1R MSN激活后go反应的增加与直接通路功能的经典模型一致；然而，根据经典模型，D2R MSN刺激预计会减少而不是增加go反应。类似地，D1R MSN的光遗传抑制减缓了动作启动，这与经典模型一致，而D2R MSN抑制并没有加快动作启动，反而增加了小鼠脱离任务的概率^89,107.

此外，尽管在DMS中直接和间接途径的活性相反地调节强化¹⁰³DLS或NAc似乎并非如此。DLS中的D2R MSN激活不会减少按下刺激配对杆，而是增加按下配对杆和未配对杆¹⁰⁸在NAc中，激活D1R或D2R MSN会促进自我刺激，尽管只有D1R刺激会增加在模拟空间位置的时间¹⁰⁹此外，在一项旨在测试动机的任务中，刺激NAc中的D1R或D2R MSN会增加动机，而抑制D2R MSNs会降低动机，导致动物比对照组更早放弃¹¹⁰（但请参见REF^111,112). 综上所述，这些研究表明，在某些条件下，间接途径可能具有完全出乎意料的作用，这些作用似乎与经典提出的拮抗直接途径功能的作用大不相同。间接途径在什么时候以及为什么发挥这些意料之外的作用尚待了解。

胆碱能中间神经元

显著信号。

尽管CIN仅占纹状体内神经元总数的1–2%，但它为纹状体结构提供了乙酰胆碱的主要来源¹¹³(图3a). 乙酰胆碱与大脑其他区域的注意力和学习有关¹¹⁴纹状体中胆碱能标记物的水平特别高^115–117，人们对纹状体CIN的功能有很大的兴趣。然而，它们的稀疏性和分布性使得这一目标特别具有挑战性。

保存图片、插图等的外部文件。对象名为nihms-1580784-f0003.jpg

在单独的窗口中打开

图3|

胆碱能中间神经元调节突触可塑性和可卡因情境消退学习。

一|纹状体电路的简化示意图，突出胆碱能中间神经元（CIN）和D₁（D1R）和D₂多巴胺受体（D2R）中棘神经元（MSN）。所有细胞类型都接受来自外部结构的谷氨酸能和多巴胺能输入。b条|最近的一项研究¹²⁸在cocaine-context关联消亡期间操纵CIN。CIN活性增加与突触前可塑性增加（对应于谷氨酸释放减少）和消退学习增加有关。此外，对照动物的长时间灭绝训练与突触可塑性的类似变化有关，这表明CIN加速了与灭绝学习相关的可塑性。SNc，黑质致密部；VTA，腹侧被盖区。零件b条经reF许可改编。¹²⁸爱思唯尔。

关于CIN在学习和决策中的作用的经典观点来自于强直活动神经元（TAN）的细胞外记录，根据体外特征或体内细胞内或细胞旁记录以及组织学鉴定，这些神经元被认为是CIN^{113,118–120}TAN对与动机相关的刺激做出短暂的反应，通常伴随着活动的增加^{65,113,121–126}有趣的是，TAN倾向于对欲望和厌恶刺激都表现出这种停顿-爆发反应。这种趋势与DA神经元形成鲜明对比，DA神经元倾向于对奖励做出积极反应，而对厌恶刺激做出消极反应（信号传导RPE）。因此，CIN被认为代表刺激的“显著性”或“动机重要性”，可能在调节学习速度方面发挥作用，而不是提供可以直接驱动学习的强化信号。

中等棘状神经元的可塑性调节。

假定的CIN（TAN）代表显著性或动机重要性，这一概念导致了一个有趣的假设——这些神经元可能调节学习和可塑性的“增益”，但不足以独自驱动这些过程，因为尽管它们在学习应该发生的时候作出反应，它们不提供关于学习方向的信息，因为对欲望和厌恶刺激的反应是相似的。

最近的光遗传学实验为CIN调节学习增益的观点提供了支持。例如，NAc中CIN活性的增加加速了可卡因CPP的灭绝；相反，降低CIN活性可以减缓这些关联的消失（或获得）^127,128增强的消亡学习伴随着对MSN谷氨酸能输入的突触强度降低¹²⁸(图3b). 然而，当CIN在学习环境之外被激活时，突触强度不会发生这种变化。同样，CIN的激活本身不足以支持学习（例如，在实时CPP或颅内自我刺激任务中）¹²⁸总之，这些研究结果表明，CIN在发生学习增益时调节学习增益，但本身并不驱动强化学习。

在需要灵活更新以前学习过的关联的环境中，CIN在调节学习速度方面可能特别重要^129–133背纹状体或VS中CIN的细胞类型特异性损伤不影响行动的初始学习-结果关联，但在任务突发事件改变时会损害表现^130,132当相关任务特征改变时，CIN消融增加了旧策略的坚持性¹³⁰并削弱了动物区分不同行动的能力——贬值测试中的意外结果¹³²（但见reF。¹³¹).

CIN如何调整MSN以支持学习？CIN通过各种机制抑制MSN^{127,134–136}; 因此，CIN活动中的暂停可以解除MSN的抑制，提高其对行为相关信息的响应能力。此外，CIN触发中脑DA神经元纹状体末端的DA释放，这可能直接增强可塑性^137,138此外，如上所述，CIN可以调节谷氨酸能输入-MSN突触的可塑性¹²⁸这些机制如何影响学习和决策，以及哪些其他机制可能重要，是该领域的关键开放研究领域。

谷氨酸能输入

纹状体回路的一个关键组成部分是谷氨酸能输入，它从皮层以及丘脑、杏仁核和海马等皮层下结构汇聚到纹状体。大脑皮层和丘脑神经元向纹状体投射，因此不同的纹状体亚区接收大脑皮层和大脑丘脑输入的不同组合^139–146(图4a). 事实上，谷氨酸能输入的解剖分布的无监督聚类已被用于恢复传统纹状体亚区（例如DMS、DLS和NAc）之间的边界，并发现纹状体的新亚区（主要在DMS内）^147,148.

保存图片、插图等的外部文件。对象名为nihms-1580784-f0004.jpg

在单独的窗口中打开

图4|

纹状体的谷氨酸能输入。

一|三个示例皮质-基底神经节-丘脑-皮质环的示意图，其中皮质纹状体投射来自边缘前皮质（PL）、前扣带回（ACC）和初级运动皮质（M1）。纹状体的输入是按地形组织的，这种组织贯穿基底神经节^140,147,148.b条|谷氨酸能输入为纹状体亚区提供功能专门化。例如，从听觉皮层（AC）到纹状体尾部（TS）的投射是按眼压组织的，TS神经元的频率调谐与AC输入的频率调谐相对应¹⁵⁸。当大鼠学会对低频或高频听觉刺激进行左右鼻部戳戳以获得奖励时（左上角），调谐到奖励频率的皮质纹状体突触选择性增强（右上角以红色表示）。因此，如果小鼠学会在低频刺激后进行右鼻子戳戳，则从左侧（即对侧）AC到左侧纹状体的低频输入将增强（右上角）¹⁵⁸在相同的任务中，从AC投射到TS的神经元的光遗传学操作对选择产生双向偏差（较低）¹⁵²这些神经元的激活使选择偏向于操作AC神经元的首选频率，而抑制则使选择偏离。DLS，纹状体背外侧；DMS，背内侧纹状体；苍白球；内侧背侧丘脑；NAc，伏隔核；VAL，腹侧前-双侧复合体；VM，腹内侧核；腹侧苍白球副总裁。零件b条改编自reF。¹⁵²Springer Nature有限公司。

为纹状体亚区提供功能专门化。

纹状体回路的一个经典观点是，每个谷氨酸能输入的神经活动都特定于其目标区域，并决定该区域的功能。为了测试这个模型，许多重要的研究已经开始通过根据神经元的投射，专门针对神经元，来研究纹状体谷氨酸能输入在学习和决策任务中的功能专门化^149–176.

其中一些研究支持谷氨酸能输入为纹状体亚区提供功能专门化的观点。例如，TS的谷氨酸能输入被认为是专门用于处理感官信息和支持感官指导决策的^177–180.从听觉皮层到TS的投射是按眼压组织的¹⁵⁸TS中记录的神经元具有与支配它们的听觉皮层神经元相似的听觉反应¹⁵²(图4b). 在双选择听觉辨别任务中，特别刺激投射到纹状体的听觉皮层神经元会使选择偏向于与模拟神经元的首选频率相关的动作，而抑制则会产生相反的效果¹⁵²此外，在大鼠学习了这种听觉辨别任务后，编码奖励听觉刺激的皮质纹状体神经元的突触被选择性增强¹⁵⁸.

输入专门化的进一步证据来自对mPFC输入到NAc在学习中的作用的检查(表1). 这些神经元参与同种和空间位置之间的学习联系¹⁶⁵但并不需要获得巴甫洛夫条件反射（尽管它们涉及条件反射行为的表达）¹⁶⁴此外，mPFC–NAc预测不涉及学习特定动作或线索与奖励的关联（尽管它们涉及在这些任务之间切换）¹⁷¹因此，从mPFC到NAc的投影似乎专门用于支持某些类型的学习。

表1|

NAc在学习和决策中谷氨酸能输入的视基因测试

投影	目标	行为	结果^一	参考
百万PFC	NAc公司	ICSS和CPP^b条	终端的激活加强了触发刺激的行为	¹⁵⁰
			终端的激活对触发刺激的行为没有影响	^149,164
			mPFC–NAc神经元的激活减少了在受刺激空间位置花费的时间	¹⁶⁸
mPFC（PL）	NAc公司	巴甫洛夫条件反射	mPFC–NAc神经元的激活增加，失活减少，条件性寻求回报行为的表达	¹⁶⁴
mPFC（损益）	NAc核心	社会CPP	mPFC–NAc神经元的激活增加，失活减少，学习社会目标和空间位置之间的关联	¹⁶⁵
mPFC（损益）	NAc核心	任务切换	PL终端的激活减少，PL终端抑制增加持续性错误	¹⁷¹
BLA公司	NAc公司	ICSS和CPP	刺激BLA–NAc投射可提高触发刺激的操作行为的表现	^149,150,157
BLA公司	NAc公司	ICSS和CPP	刺激BLA–NAc投影会增加刺激配对空间定位所花费的时间	¹⁵⁰
BLA公司	国家审计委员会	巴甫洛夫条件反射	抑制BLA–NAc终末减少条件性奖赏寻求	¹⁴⁹
vHipp公司	NAc外壳	ICSS和实时CPP	vHipp–NAc终端的激活增强了操作行为并增加了在受刺激空间位置上花费的时间	¹⁵⁰
vHipp公司	NAc外壳	社交记忆	抑制vHipp–NAc终端损害社会歧视	¹⁶¹
vHipp公司	NAc公司	清洁石油产品	vHipp–NAc突触的光诱导LTP增加了被刺激空间位置的时间；抑制vHipp–NAc终端会损害社会目标与空间位置的关联	¹⁷³
dCA1型	NAc公司	清洁石油产品	抑制dCA1-NAc末端损害蔗糖CPP的提取	¹⁷⁵
PVT公司	NAc外壳	注册会计师	PVT–NAc终端的激活减少了在受刺激空间位置上花费的时间	¹⁶⁰
ILT公司	NAc公司	社会压力	抑制ILT–NAc终末减少慢性社交失败压力后的社交回避	¹⁵⁹
谷氨酸能神经元	NAc公司	ICSS系统	刺激VTA–NAc谷氨酸能终末加强操作行为	¹⁶²

在单独的窗口中打开

基底外侧杏仁核；条件位置厌恶；CPP，条件位置偏好；dCA1，海马背区CA1；颅内自我刺激；ILT，丘脑层内；LTP，长期增强；内侧前额叶皮层；NAc，伏隔核；PL，边缘前皮质；室旁丘脑；vHipp，腹侧海马；VTA，腹侧被盖区。

^一所有实验都使用光遗传学来激活或抑制神经元或终末。

^b条不同实验的结果不同。

除了特定输入是否专门用于特定行为功能外，一个相关的问题是同一目标区域的多个输入是否具有不同或冗余的功能。事实上，NAc的一些投入似乎专门用于奖励学习，这被认为是该次区域的一项主要职能(表1). 例如，对NAc的几个输入似乎正在增强：小鼠将学会执行一个动作，触发基底外侧杏仁核（BLA）向NAc投射的光基因刺激^149,150,157或腹侧海马¹⁵⁰与这些观察结果一致，BLA到NAc的投射失活减少了条件舔舔对奖赏提示的反应¹⁴⁹相反，抑制这种投射并不影响恐惧学习的获得¹⁵⁷虽然NAc的多种输入支持奖励学习，但丘脑的几种输入可能具有相反的厌恶效应。刺激脑室旁丘脑（PVT）向NAc的投射是令人厌恶的，通过光学诱发的长期抑郁减弱这种投射会减弱阿片剂戒断厌恶症状的表达¹⁶⁰此外，慢性社交失败加强了丘脑层内向NAc的投射，而这种投射的视觉遗传抑制减少了由此产生的社交回避，而视觉遗传激活则减少了社交互动¹⁵⁹.

比较前额叶皮层不同区域对DMS的输入也可以发现不同投射之间的功能差异。在T型迷宫中，只有当最大化回报的选择与最小化厌恶刺激的选择不同时（在这种情况下，是明亮的光），才会影响决策¹⁵⁵相反，操作前扣带回皮质（ACC）的投影会影响多种类型的成本效益比较¹⁵⁵.

总之，这些研究表明纹状体的投射显示出一些功能分化。然而，需要更多的工作来确定谷氨酸输入之间存在多少冗余。

总结和未来展望

最近应用细胞类型特异性监测和操纵纹状体不同神经元群的技术，对纹状体功能的几个经典概念进行了严格测试。总结如下表2其中许多研究支持经典模型，而其他研究提供了意想不到的见解，这些见解挑战并反驳了某些主流观点。因此，需要新的模型来更好地理解纹状体对学习和决策的贡献。

表2|

纹状体电路模型在学习和决策中的遗传和光学测试

经典视图	方法	结果	支持经典视图？	参考
DA用作教学信号	视基因操作	DA激活促进巴甫洛夫条件反射，抑制促进巴甫洛夫过度扩张的消退	是的	^25,47,54,206
		DA操作双向调节在激光配对位置花费的时间	是的	^49,50
		DA操作双向调节基于模型的关联	是的	⁴⁸
		DA操作双向调节Yes刺激相关操作行为的性能	是的	^50–52,55
DA神经元编码RPE	DA神经元或其纹状体轴突的记录（使用Ca²⁺成像或光标记）	已识别的DA神经元编码RPE和/或奖励	是的	^36,58,59,63
	DA神经元或其纹状体轴突的记录（使用Ca²⁺成像或光标记）	已识别的DA神经元编码非RPE信息	不	^{23,55,58–61,63}
	视基因操作	操纵SNc-DA细胞体或末端双向调节运动	不	^59,63,64
	视基因操作	投射到TS的DA神经元的激活增强了回避行为	不	⁶⁰
D1R和D2R神经元相反地调节行为	视基因操作	D1R MSN激活增加，而D2R MSN的激活减少自发运动	是的	^72,183,184
		在基于价值的决策中，D1R和D2R是MSN的激活相反地偏向于选择	是的	^90,102
		D1R MSN的激活促进刺激配对行为的表现，D2R MSN激活降低刺激配对行为（在DMS和NAc中）的表现	是的	^103–105
		DLS中D1R和D2R MSN的激活促进了刺激配对杠杆的按下，但DLS中D2R MSNs的激活也增加了未配对杠杆的按压	不	¹⁰⁸
		激活D1R和D2R MSN可以提高刺激配对行为的性能，但只有D1R激活会增加在刺激配对位置花费的时间（在NAc中）	不	¹⁰⁹
		D1R和D2R MSN的激活促进无感觉go/No-go任务中的go反应	不	¹⁰⁶
		D1R和D2R MSN的激活增加了动机	不	¹¹⁰
		D1R MSN抑制减缓动作启动，但D2R MSN阻止降低任务参与度	不	^89,107
D1R和D2R MSN对行为变量编码相反	已识别神经元的记录（Ca²⁺成像或光标记）	D1R和D2R神经元在自发运动和训练运动期间同时活动	不	^{79–84,87,89–91}
D1R和D2R MSN对行为变量编码相反	已识别神经元的记录（Ca²⁺成像或光标记）	D1R和D2R神经元相反地编码值	是的	^90,91,99
CIN暂停–突发活动表明显著性并调节学习	视基因操作	CINs双向调节可卡因CPP消亡率	是的	^127,128
CIN暂停–突发活动表明显著性并调节学习	细胞类型特异性消融	CIN消融削弱学习关联的灵活更新	是的	^130–132

在单独的窗口中打开

胆碱能中间神经元；CPP，条件位置偏好；D1R、D₁多巴胺受体；D2R、D₂多巴胺受体；多巴胺；DLS，纹状体背外侧；DMS，背内侧纹状体；MSN，中等棘神经元；NAc，伏隔核；RPE，奖励预测误差；SNc，黑质致密部；TS，纹状体尾部。

例如，终止于纹状体的DA神经元在复杂的决策过程中会显示出不同的信号⁵⁸这表明，假设这些神经元只向纹状体提供RPE信号的模型是不完整的。DA神经元中的异质信号实际上可能代表特定类型的预测错误，以支持特定类型的学习。例如，建议将DA输入到TS，以指示威胁预测中的错误⁶⁰然而，在这一点上，是否可以将异质DA信号视为特定类型的预测误差来支持特定方面的学习尚不清楚。事实上，最近的一项研究考察了在基于价值的决策任务中，对侧选择时激活DA对DMS的预测是否与对侧运动或与对侧动作的专门RPE更相关，并得出结论，信号与运动更相关⁶²因此，一些DA信号可能根本不反映预测误差。

即使所有DA信号都不能反映RPE，所有DA神经元都可能通过释放DA来调节纹状体的可塑性和兴奋性。因此，由于DA活动与运动相关，纹状体可塑性与兴奋性也会受到运动的调节^59,63而不是（或除了）奖励。这种运动生成的可塑性可能会调节正在进行的运动的连续性和活力。同样，由于DA活动与内部状态相关，例如决策过程中的行为准确性⁵⁸，DA释放和随后的DA介导的可塑性可能维持正在进行的内部状态的连续性。为了探究特殊的非RPE DA信号的功能，需要进行新的研究，专门针对DA神经元在引发这些信号的学习和决策范式中的功能亚群。

间接和直接途径MSN的记录也为经典模型提供了令人兴奋的新挑战。主要挑战来自这样一个事实，即D1R和D2R MSN在训练和自发运动期间似乎是相互作用的^{79–82,84,90,91}然而，与经典模型一致，D1R和D2R神经元的活动受到强化学习和决策范式中的值的相反调节^90,91,99可能通过DA信号对D1R和D2R MSN的突触可塑性（或兴奋性）的差异效应^{40,42,181,182}在这个框架中，奖励期间活跃的输入如果以D1R MSN为目标，则会增强，如果以D2R MSN作为目标，则将减弱。因此，D1R和D2R神经元中相反的活动模式在学习和决策范式中最为明显，此时DA在特定时间点释放，以不同方式调节这两条通路。与每个纹状体分区相关的特定学习范式可能不同；因此，这两种途径中的相反活动可能是行为特异性的。这种想法最好通过在学习和决策任务期间抑制每个亚群的内源性活动来检验，而不是通过人工激活。迄今为止，大多数MSN功能的光遗传学检查都依赖于兴奋性视蛋白^{72,90,102–105,183,184}它以人工模式强烈地同步激活了许多神经元，因此对于这两个群体中的内源性活动是否相反几乎没有提供任何见解。因此，尽管有许多基础实验，但经典的go/no-go模型仍有待全面测试。

事实上，尽管近年来取得了广泛进展，但来自纹状体功能经典模型的几个假设尚未得到充分测试。例如，CIN被认为是通过暂停-突发触发来发出显著事件的信号，并被认为支持学习。然而，在学习和决策过程中，这些活动模式尚未被直接复制，CIN活动中的停顿是否确实对其学习调节至关重要尚不清楚（尽管参见参考文献。¹⁸⁵间接操纵CIN）。

此外，还需要做更多的工作，将谷氨酸能输入中的神经活动与经典观念联系起来，这些观念的可塑性是学习和决策的基础。例如，对皮质纹状体可塑性是基于奖励的学习的神经基质这一观点的一个基本检验是，学习新的行为关联是否需要谷氨酸能投射来表达它们¹⁸⁶情况是否如此尚不清楚。此外，具体的谷氨酸输入是否专门用于支持或调节任务执行的不同要素，如动机或行动选择，也不清楚。解决这些问题需要在一个一致的行为框架内，在试验和跨学习的不同时间点，对多种谷氨酸能输入进行系统比较。

总之，记录和操纵已确定神经元种群的研究解决了许多关于纹状体回路在学习和决策中的作用的长期假设。这一新证据支持了这些经典模型的某些组成部分，尽管也出现了对经典思想的重大挑战。未来的实验必须设计来应对这些挑战和尚未测试的重要想法。

致谢

作者感谢L.Pinto对这份手稿的评论，以及W.Fleming提供的图形示意图。这项工作由纽约干细胞基金会（NYSCF）、皮尤、McKnight、NARSAD（美国国家精神分裂症和抑郁症研究联盟）和斯隆基金会资助。；美国国立卫生研究院（NIH）授予U19 NS104648-01、DP2 DA035149-01和5R01MH106689-02（给I.B.W.）和F32 MH112320-02（给J.C.）；和陆军研究办公室拨款W911NF-17-1-0554。I.B.W.是NYSCF-Robertson调查员。

词汇表

基底神经节	一组进化上保守的相互连接的皮层下核，参与运动、认知和边缘过程
强化学习	通过积极或消极的反馈来改变行为表现的学习过程
内侧前脑束	包含多巴胺能轴突的白质束，从腹侧被盖区和黑质致密部到纹状体
刺激-结果关联	感官刺激和他们预测的结果之间的联系，这会诱发条件行为，尽管结果的经验与该行为无关
刺激-反应关联	导致对感官刺激作出反应的动作表现的关联，无论动作结果的价值如何
行动-结果关联	行动（或回应）与行动结果之间的关联，其绩效取决于结果的价值
概率反转学习任务	一项行为任务，参与者学习行动与奖励概率之间的关联，然后将其颠倒，需要更新所学关联
有条件的位置首选项：（CPP）	一种测量前后关联的分析，用于评估动物在与特定刺激相关的空间位置上花费的时间
贬值测试	衡量一项行为的表现，其习得结果会贬值（例如，饱足感），以评估一种行为是否更具目标导向性或习惯性
成本效益比较	与利益（如奖励）和成本（如惩罚）相关的行动之间的比较

脚注

竞争性利益

作者声明没有相互竞争的利益。

出版商备注

Springer Nature在公布的地图和机构关联中的管辖权主张方面保持中立。

审核人信息

自然评论-神经科学感谢D.Sulzer和其他匿名评审员对这项工作的同行评审所做的贡献。

工具书类

1Alexander GE、DeLong MR&Strick PL连接基底神经节和皮层的功能隔离电路的平行组织.每年。神经科学评论 9, 357–381 (1986). [公共医学][谷歌学者]

2.Alexander GE&Crutcher医学博士基底神经节回路的功能结构：并行处理的神经基质.神经科学趋势.13, 266–271 (1990). [公共医学][谷歌学者]

三。雷德格雷夫P等。基底神经节的目标导向和习惯性控制：对帕金森病的影响.神经科学自然评论 11, 760–772 (2010).[PMC免费文章][公共医学][谷歌学者]

4Gerfen CR&Bolam JP公司基底神经节结构和功能手册第2版第卷。24（编辑Steiner H&Tseng KY）3-32（爱思唯尔，2016）。[谷歌学者]

5Loopuijt LD和van der Kooy D纹状体的组织：传出轴突的侧支化.脑研究.348, 86–99 (1985). [公共医学][谷歌学者]

6.Gerfen CR和Scott Young W纹状体和纹状体肽能神经元在斑块和基质中的分布：原位杂交组织化学和荧光逆行示踪研究.脑研究.460, 161–167 (1988). [公共医学][谷歌学者]

7Kawaguchi Y、Wilson CJ和Emson PC细胞内注射生物素揭示大鼠新纹状体基质细胞的投射亚型.神经科学杂志.10, 3421–3438 (1990).[PMC免费文章][公共医学][谷歌学者]

8Gerfen CR公司等。D1和D2多巴胺受体调节纹状体和纹状体前脑神经元的基因表达.科学类 250, 1429–1432 (1990). [公共医学][谷歌学者]

9Wu Y、Richard S和家长A纹状体输出系统的组织：大鼠单细胞近细胞标记研究.神经科学。雷斯.38, 49–62 (2000). [公共医学][谷歌学者]

10Albin RL、Young AB和Penney JB基底神经节疾病的功能解剖.神经科学趋势.12, 366–375 (1989). [公共医学][谷歌学者]

11骑士G&德尼奥JM去抑制是纹状体功能表达的基本过程.神经科学趋势.13, 277–280 (1990). [公共医学][谷歌学者]

12德隆MR基底节源性运动障碍的灵长类动物模型.神经科学趋势.13, 281–285 (1990). [公共医学][谷歌学者]

13水貂JW基底神经节：竞争性运动程序的集中选择和抑制.掠夺。神经生物学.50, 381–425 (1996). [公共医学][谷歌学者]

14Lanciego JL、Luquin N和Obeso JA基底神经节的功能神经解剖学.冷泉港。透视。医学 2，a009621（2012）。[PMC免费文章][公共医学][谷歌学者]

15Nelson AB和Kreizer AC公司基底节功能和功能障碍的再评估模型.每年。神经科学评论 37, 117–135 (2014).[PMC免费文章][公共医学][谷歌学者]

16Bolam JP，Wainer BH&Smith AD公司大鼠新纹状体胆碱能神经元的特征。胆碱乙酰转移酶免疫细胞化学、高尔基免疫增强和电子显微镜的结合.神经科学 12, 711–718 (1984). [公共医学][谷歌学者]

17Burke DA、Rotstein HG和Alvarez VA纹状体局部回路：一种新的侧抑制框架.神经元 96, 267–284 (2017).[PMC免费文章][公共医学][谷歌学者]

18Tepper JM&Koós T公司基底神经节结构和功能手册第2版第卷。24（eds Steiner H&Tseng KY）157–178（Elsevier，2016）。[谷歌学者]

19伯克JD纹状体快刺中间神经元的功能特性.前面。系统。神经科学.5, 45 (2011).[PMC免费文章][公共医学][谷歌学者]

20.Beckstead RM、Domesick VB和Nauta WJ大鼠黑质和腹侧被盖区的传出联系.脑研究.175, 191–217 (1979). [公共医学][谷歌学者]

21斯旺森LW大鼠腹侧被盖区及其邻近区域的投射：荧光逆行示踪和免疫荧光联合研究.Brain Res.公牛.9, 321–353 (1982). [公共医学][谷歌学者]

22拉梅尔S等。双重中皮质边缘多巴胺系统中前额叶中层神经元的独特特性.神经元 57, 760–773 (2008). [公共医学][谷歌学者]

23勒纳TN等。完整脑分析揭示了SNc多巴胺亚回路携带的独特信息.单元格 162, 635–647 (2015).[PMC免费文章][公共医学][谷歌学者]

24贝尔KT等。系统输入输出映射揭示VTA多巴胺神经元的电路结构.单元格 162, 622–634 (2015).[PMC免费文章][公共医学][谷歌学者]

25桑德斯英国电信（Saunders BT）、理查德·杰姆（Richard JM）、马戈利斯EB&贾纳克（Janak PH）多巴胺神经元利用电路定义的动机特性创造巴甫洛夫条件刺激.自然神经科学.21, 1072–1083 (2018). 本研究显示VTA-DA激活如何增加相关条件刺激的值，而SNc-DA激活如何在不增加其值的情况下增加对条件刺激的条件反应。[PMC免费文章][公共医学][谷歌学者]

26普林J-F等。使用交叉遗传方法绘制分子定义的多巴胺神经元亚型的投影图.自然神经科学.21, 1260–1271 (2018).[PMC免费文章][公共医学][谷歌学者]

27Montague PR，Dayan P&Sejnowski TJ公司基于预测Hebbian学习的中脑多巴胺系统框架.神经科学杂志.16, 1936–1947 (1996).[PMC免费文章][公共医学][谷歌学者]

28Schultz W，Dayan P&Montague公关预测和奖励的神经基质.科学类 275, 1593–1599 (1997). 这篇开创性的论文将DA活动与强化学习模型联系起来。[公共医学][谷歌学者]

29米雷诺维奇J&舒尔茨W中脑多巴胺神经元通过欲望刺激而非厌恶刺激优先激活.自然 379, 449–451 (1996). [公共医学][谷歌学者]

30霍勒曼JR&舒尔茨W多巴胺神经元报告在学习过程中对奖赏的时间预测有误.自然神经科学.1, 304–309 (1998). [公共医学][谷歌学者]

31舒尔茨W多巴胺神经元的预测性奖赏信号.神经生理学杂志.80, 1–27 (1998). [公共医学][谷歌学者]

32Fiorillo CD、Tobler PN和Schultz W多巴胺神经元对奖赏概率和不确定性的离散编码.科学类 299, 1898–1902 (2003). [公共医学][谷歌学者]

33Roesch MR、Calu DJ和Schoenbaum G多巴胺神经元编码大鼠更好的选择，在不同延迟或大小的奖励之间做出决定.自然神经科学.10, 1615–1624 (2007).[PMC免费文章][公共医学][谷歌学者]

34Day JJ、Roitman MF、Wightman RM和Carelli RM联想学习介导伏隔核多巴胺信号的动态变化.自然神经科学.10, 1020–1028 (2007). [公共医学][谷歌学者]

35Bromberg-Martin ES、Matsumoto M和Hikosaka O动机控制中的多巴胺：奖赏、厌恶和警觉.神经元 68, 815–834 (2010).[PMC免费文章][公共医学][谷歌学者]

36Cohen JY、Haesler S、Vong L、Lowell BB和Uchida N腹侧被盖区奖惩神经元类型特异性信号.自然 482, 85–88 (2012). 这项研究使用照片标记来证实VTA DA神经元代表RPE，而VTA GABA神经元代表预期的奖赏。[PMC免费文章][公共医学][谷歌学者]

37Eshel N公司等。多巴胺预测错误背后的算法和局部电路.自然 525, 243–246 (2015).[PMC免费文章][公共医学][谷歌学者]

38Reynolds JNJ、Hyland BI和Wickens JR奖励相关学习的细胞机制.自然 413, 67–70 (2001). [公共医学][谷歌学者]

39Reynolds JNJ&Wickens JR公司皮质纹状体突触多巴胺依赖性可塑性.神经网络.15, 507–521 (2002). [公共医学][谷歌学者]

40Shen W、Flajolet M、Greengard P&Surmeier DJ纹状体突触可塑性的多巴胺能二分法控制.科学类 321, 848–851 (2008).[PMC免费文章][公共医学][谷歌学者]

41Gerfen CR&Surmeier DJ多巴胺对纹状体投射系统的调节.每年。神经科学评论.34, 441–466 (2011).[PMC免费文章][公共医学][谷歌学者]

42Bamford NS、Wightman RM和苏尔寿D奖励行为中多巴胺对皮质纹状体突触的影响.神经元 97, 494–510 (2018). 这篇最近的综述讨论了DA在寻求奖励行为中影响皮质纹状体突触和MSN活动的机制。[PMC免费文章][公共医学][谷歌学者]

43.奥尔德斯J大脑的自我刺激；它用于研究饥饿、性和毒品的局部影响.科学类 127, 315–324 (1958). [公共医学][谷歌学者]

44科贝特·德怀斯RA颅内自我刺激与中脑上行多巴胺能系统的关系：一项可动电极标测研究.脑研究.185, 1–15 (1980). [公共医学][谷歌学者]

45Fouriezos G&Wise RA公司吡莫嗪诱发的颅内自我刺激消失：反应模式排除运动或性能缺陷.脑研究.103, 377–380 (1976). [公共医学][谷歌学者]

46明智的RA奖励和动机的前脑基质.J.公司。Neurol公司.493, 115–121 (2005).[PMC免费文章][公共医学][谷歌学者]

47斯坦伯格EE等。预测错误、多巴胺神经元和学习之间的因果关系.自然神经科学.16, 966–973 (2013).[PMC免费文章][公共医学][谷歌学者]

48夏普MJ等。多巴胺瞬变对于获取基于模型的关联是充分和必要的.自然神经科学.20, 735–742 (2017).[PMC免费文章][公共医学][谷歌学者]

49蔡H-C等。多巴胺能神经元的相控放电足以进行行为调节.科学类 324, 1080–1084 (2009).[PMC免费文章][公共医学][谷歌学者]

50伊兰戈A等。黑质和腹侧被盖多巴胺神经元在奖赏和厌恶中的类似作用.神经科学杂志.34, 817–822 (2014).[PMC免费文章][公共医学][谷歌学者]

51威顿IB等。重组酶驱动大鼠系：工具、技术和在多巴胺介导的增强中的光遗传学应用.神经元 72, 721–733 (2011).[PMC免费文章][公共医学][谷歌学者]

52.哈米德AA等。中边缘区多巴胺是工作价值的信号.自然神经科学.19, 117–126 (2016).[PMC免费文章][公共医学][谷歌学者]

53Adamantidis银币等。多巴胺能调制的多阶段寻求回报行为的光遗传学询问.神经科学杂志.31, 10829–10835 (2011).[PMC免费文章][公共医学][谷歌学者]

54更改CY等。多巴胺神经元的短暂光遗传抑制模拟内源性负回报预测错误.自然神经科学.19, 111–116 (2016).[PMC免费文章][公共医学][谷歌学者]

55帕克NF等。中脑多巴胺神经元终末的奖赏和选择编码依赖于纹状体靶点.自然神经科学.19, 845–854 (2016).[PMC免费文章][公共医学][谷歌学者]

56.奥多尔蒂J等。腹侧和背侧纹状体在工具性条件反射中的分离作用.科学类 304, 452–454 (2004). [公共医学][谷歌学者]

57Balleine BW、Delgado MR和Hikosaka O背纹状体在奖赏和决策中的作用.神经科学杂志.27, 8161–8165 (2007).[PMC免费文章][公共医学][谷歌学者]

58恩格尔哈德B等。VTA多巴胺神经元中感觉、运动和认知变量的专门编码.自然10.1038/s41586-019-1261-9（2019）。VTA DA神经元的细胞分辨率成像揭示了广泛的奖赏表征与任务变量的特殊表征的复合。[PMC免费文章][公共医学] [交叉参考][谷歌学者]

59Howe MW&Dombeck DA公司运动和奖赏期间不同多巴胺能轴突的快速信号.自然 535, 505–510 (2016). 背侧纹状体DA终末的轴突成像显示，不同的轴突发出运动和奖赏信号。[PMC免费文章][公共医学][谷歌学者]

60Menegas W、Akiti K、Amo R、Uchida N和Watabe-Uchida M投射到后纹状体的多巴胺神经元加强了对威胁性刺激的回避.自然神经科学.275, 1593 (2018). 本文表明，TS中的DA支持学习以避免威胁性刺激，而NAc中的DA则支持学习以追求奖励性刺激。[PMC免费文章][公共医学][谷歌学者]

61Menegas W、Babayan BM、Uchida N和Watabe-Uchida M小鼠腹侧和后纹状体多巴胺信号新线索的反向初始化.电子生活 6，e21886（2017）。[PMC免费文章][公共医学][谷歌学者]

62Lee RS、Mattar MG、Parker NF、Witten IB和Daw ND奖赏预测误差不能解释DMS投射多巴胺神经元的运动选择性.电子生活 8，e42992（2019）。[PMC免费文章][公共医学][谷歌学者]

63da Silva JA、Tecuapetla F、Paixáo V和Costa RM动作启动前多巴胺神经元的活动开启并激活未来的运动.自然 554, 244–248 (2018). [公共医学][谷歌学者]

64.易货JW等。超越奖赏预测误差：多巴胺在运动运动学中的作用.前面。集成。神经科学.9, 39 (2015).[PMC免费文章][公共医学][谷歌学者]

65Joshua M、Adler A、Mitelman R、Vaadia E和Bergman H中脑多巴胺能神经元和纹状体胆碱能中间神经元编码概率经典条件反射试验不同时期奖赏和厌恶事件的差异.神经科学杂志.28, 11673–11684 (2008).[PMC免费文章][公共医学][谷歌学者]

66.松本M&Hikosaka O两种类型的多巴胺神经元分别传递积极和消极的动机信号.自然 459, 837–841 (2009).[PMC免费文章][公共医学][谷歌学者]

67Brischoux F、Chakraborty S、Brierley DI和Ungless MA伤害性刺激对腹侧VTA多巴胺神经元的时相兴奋.程序。美国国家科学院。科学。美国 106, 4894–4899 (2009).[PMC免费文章][公共医学][谷歌学者]

68.Gangarossa G公司等。表达D1R和D2R的中型棘神经元沿小鼠背侧纹状体的头尾轴的空间分布不同.前面。神经电路 7, 124 (2013).[PMC免费文章][公共医学][谷歌学者]

69Hikosaka O、Takikawa Y和Kawagoe R基底神经节在控制目的性扫视眼动中的作用.生理学。利润.80, 953–978 (2000). [公共医学][谷歌学者]

70Calabresi P、Picconi B、Tozzi A、Ghiglieri V和Di Filippo M基底神经节的直接和间接通路：一项重要的再评价.自然神经科学.17, 1022–1030 (2014). [公共医学][谷歌学者]

71奥尔登堡IA&Sabatini BL基底节直接和间接通路对初级运动皮层的拮抗但非对称调节.神经元 86, 1174–1181 (2015).[PMC免费文章][公共医学][谷歌学者]

72玫瑰果TK等。基底神经节对脑干运动回路的细胞类型特异性控制.单元格 164, 526–537 (2016).[PMC免费文章][公共医学][谷歌学者]

73Lauwereyns J、Watanabe K、Coe B和Hikosaka O猴尾状核反应偏差的神经相关性.自然 418, 413–417 (2002). [公共医学][谷歌学者]

74Samejima K、Ueda Y、Doya K和Kimura M纹状体中行动特定奖励值的表示.科学类 310, 1337–1340 (2005). [公共医学][谷歌学者]

75Lau B和Glimcher PW匹配行为中灵长类纹状体的价值表征.神经元 58, 451–463 (2008).[PMC免费文章][公共医学][谷歌学者]

76丁磊和金记Caudate对感知决策的多次计算进行编码.神经科学杂志.30, 15747–15759 (2010).[PMC免费文章][公共医学][谷歌学者]

77龚S等。用细菌人工染色体构建物靶向特定神经元群体的Cre重组酶.神经科学杂志.27, 9817–9823 (2007).[PMC免费文章][公共医学][谷歌学者]

78Gerfen CR、Paletzki R和Heintz N公司GENSAT BAC重新组合驱动线路以研究大脑皮层和基底神经节回路的功能组织.神经元 80, 1368–1383 (2013).[PMC免费文章][公共医学][谷歌学者]

79崔G等。动作启动期间纹状体直接和间接通路的同时激活.自然 494, 238–242 (2013). 这项研究首次表明，与纹状体功能的一些理论相反，D1R和D2R MSN在运动时是共同激活的，在静止时是不活动的。[PMC免费文章][公共医学][谷歌学者]

80巴贝拉G等。背侧纹状体的空间致密神经簇编码运动相关信息.神经元 92, 202–213 (2016).[PMC免费文章][公共医学][谷歌学者]

81克劳斯A等。纹状体的时空组织编码动作空间.神经元 96, 949 (2017).[PMC免费文章][公共医学][谷歌学者]

82马科维茨JE等。纹状体通过瞬间动作选择组织3D行为.单元格 174, 44–58 (2018). 本研究使用机器学习算法将自发行为特征化为离散的亚秒成分，并描述了D1R和D2R MSN对这些行为成分的身份和顺序的响应。[PMC免费文章][公共医学][谷歌学者]

83帕克·JG等。帕金森病和运动障碍状态下的径向神经集成动力学.自然 557, 177–182 (2018). 本研究深入探讨了多巴胺能激动剂和拮抗剂对体内D1R表达和D2R表达MSN活性的影响。[PMC免费文章][公共医学][谷歌学者]

84孟C等。用于脑回路多组分分析的光谱分辨纤维光度法.神经元 98, 707–717 (2018).[PMC免费文章][公共医学][谷歌学者]

85伦敦TD等。食物摄入和摄入前背纹状体通路的协调性增加.神经科学杂志.38, 3547–3558 (2018).[PMC免费文章][公共医学][谷歌学者]

86Isomura Y公司等。纹状体神经元的奖赏调制运动信息.神经科学杂志.33, 10209–10220 (2013).[PMC免费文章][公共医学][谷歌学者]

87Jin X、Tecuapetla F和Costa RM基底神经节亚电路对动作序列的解析和串联进行独特编码.自然神经科学.17, 423–430 (2014).[PMC免费文章][公共医学][谷歌学者]

88Sippy T、Lapray D、Crochet S和Petersen CCH纹状体投射神经元在目标定向行为中的细胞类型特异性感觉运动加工.神经元 88, 298–305 (2015).[PMC免费文章][公共医学][谷歌学者]

89Geddes CE、Li H和Jin X视生编辑揭示了学习动作序列的层次结构.单元格 174, 32–43 (2018).[PMC免费文章][公共医学][谷歌学者]

90Nonomura S公司等。通过纹状体直接和间接途径监测和更新目标导向行为的行动选择.神经元 99, 1302–1314 (2018). [公共医学][谷歌学者]

91Donahue CH、Liu M和Kreitzer A适应性学习期间纹状体直接和间接通路中的差异值编码.bioRxiv预打印10.1101/277855 (2018). [交叉参考][谷歌学者]

92Tecuapetla F、Matias S、Dugue GP、Mainen ZF和Costa RM基底神经节投射通路的平衡活动对反向运动至关重要.国家公社.5, 4315 (2014).[PMC免费文章][公共医学][谷歌学者]

93卡佐拉M等。多巴胺D2受体调节基底节回路的解剖和功能平衡.神经元 81, 153–164 (2014).[PMC免费文章][公共医学][谷歌学者]

94柯林斯AGE&Frank MJ对立行动者学习（OpAL）：纹状体多巴胺对强化学习和选择激励的交互效应建模.精神病。利润.121, 337–366 (2014). [公共医学][谷歌学者]

95Bariselli S、Fobbs WC、Creed MC和Kravitz AV纹状体动作选择的竞争模型.脑研究.1713, 70–79 (2018).[PMC免费文章][公共医学][谷歌学者]

96Frank MJ、Seeberger LC和O'reilly RC胡萝卜还是大棒：帕金森综合征患者的认知强化学习.科学类 306, 1940–1943 (2004). [公共医学][谷歌学者]

97Peak J、Hart G和Balleine BW从学习到行动：工具性条件反射中背侧纹状体输入输出通路的整合.欧洲神经病学杂志.49, 658–671 (2019). [公共医学][谷歌学者]

98Yartsev MM、Hanks TD、Yoon AM和Brody CD证据积累过程中纹状体的因果关系和动态编码.电子生活 7，e34929（2018）。[PMC免费文章][公共医学][谷歌学者]

99Shin JH、Kim D和Jung MW公司纹状体背内侧直接和间接通路中奖赏和运动信息的差异编码.国家公社.9, 404 (2018).[PMC免费文章][公共医学][谷歌学者]

100扎洛库斯基KA等。伏隔核D2R细胞发出先验结果信号并控制风险决策.自然 531, 642–646 (2016).[PMC免费文章][公共医学][谷歌学者]

101Lau B和Glimcher PW恒河猴匹配行为的动态响应模型.《实验分析杂志》。贝哈夫.84, 555–579 (2005).[PMC免费文章][公共医学][谷歌学者]

102Tai L-H、Lee AM、Benavidez N、Bonci A和Wilbrecht L短暂刺激纹状体神经元不同亚群模拟动作值的变化.自然神经科学.15, 1281–1289 (2012).[PMC免费文章][公共医学][谷歌学者]

103Kravitz AV、Tye LD和Kreitzer AC直接和间接途径纹状体神经元在强化中的不同作用.自然神经科学.15, 816–818 (2012). 本文显示了DMS中的D1R和D2R MSN活性如何分别足以正向和负向增强颅内自我刺激，但这种学习并不依赖DA传输。[PMC免费文章][公共医学][谷歌学者]

104Yttri EA和Dudman JT基底节运动速度的对立和双向控制.自然 533, 402–406 (2016). 本研究表明，DMS中的D1R和D2R MSN活性分别足以正向和负向增强运动速度，并且这种学习依赖于DA传输。[PMC免费文章][公共医学][谷歌学者]

105洛博MK等。BDNF信号的细胞类型特异性丢失模拟可卡因奖赏的视基因控制.科学类 330, 385–390 (2010). NAc中的D1R和D2R MSN活性分别增强或抑制可卡因CPP的形成。[PMC免费文章][公共医学][谷歌学者]

106Wang L、Rangarajan KV、Gerfen CR和Krauzlis RJ纹状体神经元的激活导致小鼠视觉变化检测中的感知决策偏差.神经元 98, 669 (2018). [公共医学][谷歌学者]

107Tecuapetla F、Jin X、Lima SQ和Costa RM纹状体投射通路对动作启动和执行的补充贡献.单元格 166, 703–715 (2016). [公共医学][谷歌学者]

108Vicente AM、Galváo-Ferreira P、Tecuapetla F和Costa RM直接和间接背外侧纹状体通路强化不同的行动策略.货币。生物.26，R267-269（2016）。[PMC免费文章][公共医学][谷歌学者]

109Cole SL、Robinson MJF和Berridge KC伏隔核的视生自我刺激：D1奖励与D2矛盾.PLOS ONE系列 13，e0207694（2018）。[PMC免费文章][公共医学][谷歌学者]

110苏亚雷斯-库哈C等。伏隔核D2多巴胺受体表达神经元的激活增加了动机.国家公社.7, 11829 (2016).[PMC免费文章][公共医学][谷歌学者]

111卡瓦略·波拉兹F等。减少纹状体乳头通路功能通过激发目标导向行动的启动来增强动机.神经科学杂志.36, 5988–6001 (2016).[PMC免费文章][公共医学][谷歌学者]

112高卢EF等。伏隔多巴胺D2受体通过减少对腹侧苍白球的抑制传递来增加动机.国家公社.9, 1086 (2018).[PMC免费文章][公共医学][谷歌学者]

113Apicella P（小蜂属）纹状体固有胆碱能系统的作用：我们从行为动物的TAN记录中学到了什么？神经科学 360, 81–94 (2017). [公共医学][谷歌学者]

114哈塞尔莫ME乙酰胆碱在学习和记忆中的作用.货币。操作。神经生物学.16, 710–715 (2006).[PMC免费文章][公共医学][谷歌学者]

115麦金托什FC乙酰胆碱在外周和中枢神经系统中的分布.生理学杂志.99, 436–442 (1941).[PMC免费文章][公共医学][谷歌学者]

116Hebb CO和Silver A神经纤维中胆碱酯酶活性和胆碱乙酰酶活性的梯度：胆碱乙酰酶的活性梯度.自然 189, 123–125 (1961). [公共医学][谷歌学者]

117Lim SAO、Kang UJ和McGehee DS纹状体胆碱能中间神经元的调节和回路效应.前面。突触神经科学.6, 22 (2014).[PMC免费文章][公共医学][谷歌学者]

118Wilson CJ、Chang HT和Kitai ST大鼠新纹状体中已鉴定的巨大白杨中间神经元的放电模式和突触电位.神经科学杂志.10, 508–519 (1990).[PMC免费文章][公共医学][谷歌学者]

119Inokawa H、Yamada H、Matsumoto N、Muranishi M和Kimura M大鼠纹状体张力活性神经元和相位活性神经元的细胞旁标记.神经科学 168, 395–404 (2010). [公共医学][谷歌学者]

120Schulz JM、Oswald MJ和Reynolds JNJ视觉刺激导致纹状体胆碱能中间神经元放电暂停.神经科学杂志.31, 11133–11143 (2011).[PMC免费文章][公共医学][谷歌学者]

121Kimura M、Rajkowski J和Evarts E张力放电壳核神经元表现出集依赖性反应.程序。美国国家科学院。科学。美国 81, 4998–5001 (1984).[PMC免费文章][公共医学][谷歌学者]

122青崎T等。灵长类纹状体中张力活性神经元的反应在行为感觉运动条件反射期间发生系统性变化.神经科学杂志.14, 3969–3984 (1994).[PMC免费文章][公共医学][谷歌学者]

123.Graybiel AM、Aosaki T、Flaherty AW和Kimura M基底神经节与适应性运动控制.科学类 265, 1826–1831 (1994). [公共医学][谷歌学者]

124青崎T、格雷比埃尔AM和木村M黑质纹状体多巴胺系统对行为猴纹状体获得性神经反应的影响.科学类 265, 412–415 (1994). [公共医学][谷歌学者]

125Ravel S、Legallet E和Apicella P猴纹状体中的张力活性神经元并不优先对食欲刺激作出反应.实验大脑研究.128, 531–534 (1999). [公共医学][谷歌学者]

126Goldberg JA和Reynolds JNJ纹状体紧张性胆碱能中间神经元的自发放电和诱发停顿.神经科学 198, 27–43 (2011). [公共医学][谷歌学者]

127威顿IB等。胆碱能中间神经元控制局部回路活动和可卡因调节.科学类 330, 1677–1681 (2010).[PMC免费文章][公共医学][谷歌学者]

128Lee J、Finkelstein J、Choi JY和Witten IB连接胆碱能中间神经元、突触可塑性和古柯碱上下文关联消失期间的行为.神经元 90, 1071–1085 (2016). 这项研究表明，CINs在可卡因上下文灭绝期间调节NAc的谷氨酸能突触可塑性，这可以解释相关的行为变化。[PMC免费文章][公共医学][谷歌学者]

129Bradfield LA、Bertran-Gonzalez J、Chieng B和Balleine BW丘脑三项通路和目标定向行为的胆碱能控制：纹状体新的学习与现有学习相互交织.神经元 79, 153–166 (2013).[PMC免费文章][公共医学][谷歌学者]

130青木S、刘亚伟、祖卡A、祖卡S&威金斯JR纹状体胆碱能中间神经元在大鼠坐位移动中的作用.神经科学杂志.35, 9424–9431 (2015).[PMC免费文章][公共医学][谷歌学者]

131冈田K等。靶向纹状体胆碱能中间神经元增强位置辨别学习的灵活性.国家公社.5, 3778 (2014). [公共医学][谷歌学者]

132.马塔马莱斯M等。纹状体胆碱能中间神经元老化相关功能障碍在动作选择中产生冲突.神经元 90, 362–373 (2016). [公共医学][谷歌学者]

133科林斯AL等。伏隔核胆碱能中间神经元反对线索激发行为.生物精神病学2016年10月10日/j.biophyc.2019.02.014（2019）。[PMC免费文章][公共医学] [交叉参考][谷歌学者]

134英语DF等。GABA能电路介导纹状体胆碱能中间神经元的增强相关信号.自然神经科学.15, 123–130 (2011).[PMC免费文章][公共医学][谷歌学者]

135Nelson AB公司等。纹状体胆碱能中间神经元驱动多巴胺末端释放GABA.神经元 82, 63–70 (2014).[PMC免费文章][公共医学][谷歌学者]

136Tritsch NX、Oh W-J、Gu C和Sabatini BL中脑多巴胺神经元通过质膜摄取GABA而非合成来维持抑制性传递.电子生活三，e01936（2014）。[PMC免费文章][公共医学][谷歌学者]

137仙人掌R等。胆碱能中间神经元的选择性激活增强伏隔相多巴胺的释放：为奖赏处理设定基调.单元格代表.2, 33–41 (2012).[PMC免费文章][公共医学][谷歌学者]

138瑟尔菲尔S等。胆碱能中间神经元的同步活动触发纹状体多巴胺的释放.神经元 75, 58–64 (2012). [公共医学][谷歌学者]

139.Selemon LD和Goldman-Rakic PS恒河猴皮质纹状体投射的纵向地形图和交叉指征.神经科学杂志.5, 776–794 (1985).[PMC免费文章][公共医学][谷歌学者]

140Groenewegen HJ、Berendse HW、Wolters JG和Lohman AH前额叶皮层与纹状体前脑系统、丘脑和杏仁核的解剖关系：平行组织的证据.掠夺。脑研究.85, 95–116 (1990). [公共医学][谷歌学者]

141Flaherty AW和Graybiel AM灵长类体感系统中的皮层纹状体转换。生理映射身体部位表示的投影.神经生理学杂志.66, 1249–1263 (1991). [公共医学][谷歌学者]

142Berendse HW、Galis de Graaf Y和Groenewegen HJ大鼠前额皮质纹状体投射的地形组织及其与腹侧纹状体室的关系.J.公司。神经醇.316, 314–347 (1992). [公共医学][谷歌学者]

143Pan WX、Mao T和Dudman JT小鼠背侧纹状体的输入反映了前脑的并行电路结构.前面。神经酸盐.4, 147 (2010).[PMC免费文章][公共医学][谷歌学者]

144Wall NR、De La Parra M、Callaway EM&Kreitzer AC纹状体直接和间接投射神经元的不同神经支配.神经元 79, 347–360 (2013).[PMC免费文章][公共医学][谷歌学者]

145郭Q等。背侧纹状体投射神经元和胆碱能中间神经元输入的全脑映射.PLOS ONE系列 10，e0123381（2015）。[PMC免费文章][公共医学][谷歌学者]

146Heilbronner SR、Rodriguez Romaguera J、Quirk GJ、Groenewegen HJ和Haber SN大鼠与灵长类基于回路的皮质纹状体同源性.生物精神病学 80, 509–521 (2016).[PMC免费文章][公共医学][谷歌学者]

147Hunnicutt BJ公司等。纹状体的综合兴奋性输入图揭示了新的功能组织.电子生活 5，e19103（2016年）。[PMC免费文章][公共医学][谷歌学者]

148欣提利安H等。小鼠皮质类固醇投影仪.自然神经科学.19, 1100–1114 (2016). 本文和Hunnicutt等人（2016）的论文提供了纹状体的详细皮层和丘脑输入图，并使用聚类方法对这些输入的解剖分布进行分类，以识别纹状体亚结构域。[PMC免费文章][公共医学][谷歌学者]

149斯图伯GD等。从杏仁核到伏隔核的兴奋传递促进了奖赏寻求.自然 475, 377–380 (2011).[PMC免费文章][公共医学][谷歌学者]

150布里特JP等。伏隔核多个谷氨酸能输入的突触和行为特征.神经元 76, 790–803 (2012).[PMC免费文章][公共医学][谷歌学者]

151Koralek AC、Jin X、Long JD 2nd、Costa RM和Carmena JM皮层纹状体可塑性是学习有意神经修复技能的必要条件.自然 483, 331–335 (2012). 这项研究表明，无论运动如何，学习运动皮层神经元的神经假体控制都需要皮层纹状体可塑性，纹状体神经元的活动受到这种目标导向学习的调节。[PMC免费文章][公共医学][谷歌学者]

152.Znamenskiy P&Zador AM公司听觉皮层中的皮层神经元在听觉辨别过程中驱动决策.自然 497, 482–485 (2013).[PMC免费文章][公共医学][谷歌学者]

153MacAskill AF、Cassel JM&Carter AG公司接触可卡因可重组伏隔核的细胞类型和输入特异性连接.自然神经科学.17, 1198–1207 (2014).[PMC免费文章][公共医学][谷歌学者]

154Pascoli V型等。古柯碱诱发的可塑性控制复发成分的对比形式.自然 509, 459–464 (2014). [公共医学][谷歌学者]

155弗里德曼A等。以纹状体为靶点的皮质纹状体通路控制冲突下的决策.单元格 161, 1320–1333 (2015).[PMC免费文章][公共医学][谷歌学者]

156.罗思韦尔PE等。皮质纹状体电路对串行顺序性能的输入和输出特异性调节.神经元 88, 345–356 (2015).[PMC免费文章][公共医学][谷歌学者]

157南武里P等。区分积极关联和消极关联的电路机制.自然 520, 675–678 (2015).[PMC免费文章][公共医学][谷歌学者]

158熊Q、Znamenskiy P&Zador AM听觉辨别任务获得过程中的选择性皮质纹状体可塑性.自然 521, 348–351 (2015).[PMC免费文章][公共医学][谷歌学者]

159克里斯托弗尔DJ等。丘脑-纹状体突触兴奋性传递介导对社会应激的易感性.自然神经科学.18, 962–964 (2015).[PMC免费文章][公共医学][谷歌学者]

160Zhu Y、Wienecke CFR、Nachtrab G和Chen X丘脑对伏隔核的输入介导阿片依赖.自然 530, 219–222 (2016).[PMC免费文章][公共医学][谷歌学者]

161Okuyama T、Kitamura T、Roy DS、Itohara S和Tonegawa S腹侧CA1神经元储存社会记忆.科学类 353, 1536–1541 (2016).[PMC免费文章][公共医学][谷歌学者]

162Yoo JH公司等。腹侧被盖区谷氨酸神经元共同释放GABA并促进正强化.国家公社.7, 13697 (2016).[PMC免费文章][公共医学][谷歌学者]

163贝耶勒A等。记忆提取过程中杏仁核正负信息的发散路径.神经元 90, 348–361 (2016).[PMC免费文章][公共医学][谷歌学者]

164奥的斯JM等。前额叶皮层输出电路通过发散性线索编码引导奖赏寻求.自然 543, 103–107 (2017).[PMC免费文章][公共医学][谷歌学者]

165Murugan M公司等。前额叶皮层向下投射的社会和空间编码组合.单元格 171, 1663–1677 (2017).[PMC免费文章][公共医学][谷歌学者]

166Kupferschmidt DA、Juczewski K、Cui G、Johnson KA和Lovinger DM离散皮质纹状体输入中的并行但不可分离的处理编码技能学习.神经元 96, 476–489 (2017).[PMC免费文章][公共医学][谷歌学者]

167弗里德曼A等。慢性应激改变了纹状体-电路动力学，导致异常决策.单元格 171, 1191–1205 (2017).[PMC免费文章][公共医学][谷歌学者]

168Kim CK（金·克）等。抑制奖赏寻求的自上而下神经机制的分子和电路动力学识别.单元格 170, 1013–1027 (2017).[PMC免费文章][公共医学][谷歌学者]

169阿马代伊EA等。一夫一妻制雌性草原田鼠动态皮质纹状体活动偏向社会联结.自然 546, 297–301 (2017). 本文证明草原田鼠的配对结合调节了mPFC到NAc的投射，并且这种投射的刺激增加了对社会目标的偏好。[PMC免费文章][公共医学][谷歌学者]

170Sweis BM、Larson EB、Redish AD和Thomas MJ改变边缘下到伏隔壳电路的增益改变了经济上可分离的决策算法.程序。美国国家科学院。科学。美国 115，E6347–E6355（2018）。[PMC免费文章][公共医学][谷歌学者]

171崔Q、李Q、耿H、陈丽叶纽约多巴胺受体通过调节小鼠特定的边缘前皮质-伏隔核通路介导策略放弃.程序。美国国家科学院。科学。美国 115，E4890–E4899（2018）。[PMC免费文章][公共医学][谷歌学者]

172Díaz-Hernández E等。丘脑三项投射有助于一系列动作的启动和执行.神经元 100, 739–752 (2018). [公共医学][谷歌学者]

173LeGates助教等。奖励行为受海马-伏隔核突触强度的调节.自然 564, 258–262 (2018).[PMC免费文章][公共医学][谷歌学者]

174Hart G、Bradfield LA、Fok SY、Chieng B和Balleine BW双侧前额叶-纹状体通路对于学习新的目标导向行动是必要的.货币。生物.28, 2218–2229 (2018). [公共医学][谷歌学者]

175水槽S等。海马-伏隔三元神经元基序在空间中引导食欲记忆.单元格 176, 1393–1406 (2019).[PMC免费文章][公共医学][谷歌学者]

176Chen L、Wang X、Ge S和Xiong Q内侧膝状体和初级听觉皮层对纹状体声音表征的贡献不同.国家公社.10, 418 (2019).[PMC免费文章][公共医学][谷歌学者]

177Yamamoto S、Monosov IE、Yasuda M和Hikosaka O尾状尾中的什么信息和在哪里引导扫视到可视物体.神经科学杂志.32, 11005–11016 (2012).[PMC免费文章][公共医学][谷歌学者]

178Yamamoto S、Kim HF和Hikosaka O与视觉运动技能相关的灵长类尾状尾视觉反应的奖励值控制变化.神经科学杂志.33, 11227–11238 (2013).[PMC免费文章][公共医学][谷歌学者]

179Kim HF和Hikosaka O不同的基底节回路控制灵活稳定的行为.神经元 79, 1001–1010 (2013).[PMC免费文章][公共医学][谷歌学者]

180Kim HF、Amita H和Hikosaka O尾侧基底节对无价值视觉物体排斥反应的间接通路.神经元 94, 920–930 (2017).[PMC免费文章][公共医学][谷歌学者]

181Surmeier DJ、Ding J、Day M、Wang Z和Shen WD1和D2多巴胺受体对纹状体中棘神经元纹状体谷氨酸能信号传导的调节.神经科学趋势.30, 228–235 (2007). [公共医学][谷歌学者]

182Pawlak V&Kerr JND公司多巴胺受体激活是皮质纹状体峰时依赖性可塑性所必需的.神经科学杂志.28, 2435–2446 (2008).[PMC免费文章][公共医学][谷歌学者]

183克拉维茨AV等。基底神经节回路的光遗传控制对帕金森病运动行为的调节.自然 466, 622–626 (2010).[PMC免费文章][公共医学][谷歌学者]

184巴塞洛缪RA等。小鼠纹状体运动速度的控制.欧洲神经病学杂志.43, 1097–1110 (2016). [公共医学][谷歌学者]

185棕色MTC等。腹侧被盖区GABA投射暂停伏隔胆碱能中间神经元以增强联想学习.自然 492, 452–456 (2012). [公共医学][谷歌学者]

186Kawai R公司等。运动皮层是学习所必需的，但不是执行运动技能所必需的.神经元 86, 800–812 (2015).[PMC免费文章][公共医学][谷歌学者]

187格雷比尔AM习惯、仪式和评估大脑.每年。神经科学评论.31, 359–387 (2008). [公共医学][谷歌学者]

188Liljeholm M&O’Doherty JP公司纹状体对学习、动机和表现的贡献：一个联想解释.趋势认知。科学.16, 467–475 (2012).[PMC免费文章][公共医学][谷歌学者]

189Gruber AJ&McDonald RJ公司背景、情绪和目标的战略追求：控制动机行为的多个大脑系统之间的相互作用.前面。行为。神经科学.6, 50 (2012).[PMC免费文章][公共医学][谷歌学者]

190Balleine BW和O'Doherty JP动作控制中的人类和啮齿动物同源性：目标导向和习惯动作的皮质纹状体决定因素.神经精神药理学 35, 48–69 (2010). 本文回顾了人类和啮齿动物对纹状体参与目标导向和习惯行为的研究。[PMC免费文章][公共医学][谷歌学者]

191.Yin HH和Knowlton BJ基底神经节在习惯形成中的作用.国家神经科学评论.7, 464–476 (2006). [公共医学][谷歌学者]

192Barnes TD、Kubota Y、Hu D、Jin DZ和Graybiel AM纹状体神经元的活动反映了程序性记忆的动态编码和再编码.自然 437, 1158–1161 (2005). [公共医学][谷歌学者]

193阴HH等。技能习得和巩固过程中纹状体电路的动态重组.自然神经科学.12, 333–341 (2009).[PMC免费文章][公共医学][谷歌学者]

194Thorn CA、Atallah H、Howe M和Graybiel AM学习过程中纹状体背外侧和背内侧环路活动变化的差异动力学.神经元 66, 781–795 (2010).[PMC免费文章][公共医学][谷歌学者]

195Dolan RJ&Dayan P公司大脑中的目标和习惯.神经元 80, 312–325 (2013).[PMC免费文章][公共医学][谷歌学者]

196奥黑尔JK等。习惯性行为的特定路径纹状体基底.神经元 89, 472–479 (2016). 本文显示了习惯行为表现与DLS中D1R和D2R MSN皮质诱发活动增强之间的相关性，以及这两条通路激活的相对时间的变化。[PMC免费文章][公共医学][谷歌学者]

197Yin HH、Ostlund SB、Knowlton BJ和Balleine BW背内侧纹状体在工具性条件反射中的作用.欧洲神经病学杂志.22, 513–523 (2005). [公共医学][谷歌学者]

198.Setlow B、Schoenbaum G和Gallagher M嗅觉辨别学习中腹侧纹状体的神经编码.神经元 38, 625–636 (2003). [公共医学][谷歌学者]

199Roitman MF、Wheeler RA和Carelli RM伏隔核神经元天生就对奖赏性和厌恶性味觉刺激进行调节，对其预测因子进行编码，并与运动输出相关.神经元 45, 587–597 (2005). [公共医学][谷歌学者]

200Groenewegen HJ、Wright CI、Beijer AV和Voorn P腹侧纹状体输入和输出的收敛和分离.安·纽约学院。科学.877, 49–63 (1999). [公共医学][谷歌学者]

201.Watabe-Uchida M、Zhu L、Ogawa SK、Vamanrao A和Uchida N中脑多巴胺神经元直接输入的全脑映射.神经元 74, 858–873 (2012). [公共医学][谷歌学者]

202Mannella F、Gurney K和Baldassarre G伏隔核作为目标导向行为中价值观和目标之间的纽带：一项综述和一项新假设.前面。行为。神经科学.7, 135 (2013).[PMC免费文章][公共医学][谷歌学者]

203梅内加斯W等。投射到后纹状体的多巴胺神经元形成一个解剖上不同的亚类.电子生活 4，e10032（2015）。[PMC免费文章][公共医学][谷歌学者]

204Howe MW、Tierney PL、Sandberg SG、Phillips PEM和Graybiel AM纹状体中多巴胺信号的延长表示远距离奖赏的接近和价值.自然 500, 575–579 (2013).[PMC免费文章][公共医学][谷歌学者]

205Freeze BS、Kravitz AV、Hammack N、Berke JD&Kreitzer AC公司直接和间接通路投射神经元对基底节输出的控制.神经科学杂志.33, 18531–18539 (2013).[PMC免费文章][公共医学][谷歌学者]

206金·KM等。自然奖赏对多巴胺神经元瞬时激活的光遗传学模拟足以增强操作性.PLOS ONE系列 7，e33612（2012）。[PMC免费文章][公共医学][谷歌学者]