促进和压制行动。
在背侧纹状体,直接通路的MSN表达D1多巴胺受体(D1R),并抑制基底神经节的主要输出核——内部苍白球(GPi)和黑质网状部(SNr)。相比之下,间接途径MSN表达D2多巴胺受体(D2R)和间接增加基底节输出7,8,68(). 这两条通路功能的经典观点是,它们通过相反地调节基底节输出核的放电速率来区别调节行为2,10,12,13,15例如,直接通路的激活将导致脑干运动结构以及以运动皮层为靶点的丘脑核团的去抑制,从而促进运动。间接途径驱动基底节输出核的进一步激活,从而促进对其靶点的抑制,抑制运动2,10,12,13,69–72该提案通常被称为“执行/不执行”模型。
行为的直接和间接途径调节。一|通过基底神经节的直接和间接通路的简化示意图。直接途径和间接途径功能的“go/no-go”模型提出,当D1构成直接通路的多巴胺受体(D1R)中棘神经元(MSN)被激活(左),它们抑制基底神经节的初级输出核:苍白球(GPi)和网状黑质(SNr)。GPi和SNr能抑制脑干和丘脑核团,这些核团通过D1R MSN激活而被解除抑制。当多巴胺D2间接通路的受体(D2R)MSN被激活(右),它们抑制外侧苍白球(GPe),后者向GPi、SNr和丘脑底核(STN)发送抑制性投射。因此,GPi、SNr和STN被去抑制。STN向GPi和SNr发送兴奋性输入,进一步激活并抑制其脑干和丘脑靶点2,10,12,13,69,72,205.b条|细胞类型特异性细胞外记录的示意数据90D1R和D2R神经元在所选动作中具有相似的激活模式和选择性,但对结果的编码相反。c|在决策任务中,D1R或D2R MSN的光基因刺激会产生相反的偏差,这些偏差取决于两个选项之间的动作值差异(动作结果的估计值)。零件b条经reF许可进行改编。90爱思唯尔。零件c改编自reF。102Springer Nature有限公司。
在其最简单的形式中,go/no-go模型提出了一个简单的假设,即每个通路代表什么信息:D1R神经元在动作过程中会活跃(因为它们促进它们),而D2R神经元在行动过程中会不活跃(因为他们抑制它们)。一项相关建议建议,D1R MSN编码选定的行为,而D2R MSN则编码未选定的行为13,69.
go/no-go模型可以扩展到学习和决策,这两种途径对这些过程施加相反的控制。例如,纹状体区域,如DMS或VS,接收来自前额叶皮层的输入,可能会对基于价值的决策产生相反的影响,而TS等次区域,接收来自感觉皮质的输入,则可能会对感知决策产生相反影响。然而,迄今为止,大多数研究主要考察了自发运动背景下的go/no-go模型,其中控制这些运动的学习和决策变量没有明确控制。为了完整起见,并且由于对自发运动的研究可以提供对这些解剖路径如何在决策环境中控制运动的见解,我们在下面回顾了对自发运动和决策的研究。
尽管活动模式相似,但效果相反。
虽然纹状体MSN的电生理记录揭示了感觉刺激、运动和价值的神经相关性73–76这些研究无法区分D1R和D2R MSN,因此很难测试go/no-go模型的预测。靶向D1R和D2R MSN的转基因小鼠系的建立77,78已经能够独立地识别和操纵这两个群体,以评估关于其内源性活动的假设。
虽然经典的go/no-go模型可以预测运动过程中两条路径中相反的活动模式,但令人惊讶的是,来自背侧纹状体两种MSN的记录却显示出非常相似的活动模式。例如,这两条路径在运动中比静止时更为活跃79–85,在训练期间同样活跃79,86–91和自发运动80–84,编码动物的速度80–83在对侧运动中优先活跃79,91,92这些数据表明,直接和间接路径同时协调运动;事实上,这两条途径之间有相当大的沟通7,9,17,70,93因此,直接与间接通路功能的简单go/no-go模型可能不完整。
尽管这些数据与go/no-go模型的最简单解释相矛盾,但它们可以解释为直接途径促进所选动作,而间接途径抑制替代动作13,69,79这一解释引发了一个有趣且可测试的预测,即直接通路神经元比间接通路神经元对动作更具选择性,因为在任何时间点,未选择的动作都远多于选择的动作。测试这个模型需要检查可以分析两个以上动作的神经相关性的行为,这在大多数关于自发运动的研究中都不是这样,据我们所知,在决策任务中根本没有实现。然而,最近对自发行为的研究表明,机器学习算法将运动分为多个离散成分,这种模型可能也不完整81,82这些详细的分析表明,这两个种群同时编码自发行为81,82在两条途径中具有相似程度的特异性81,83这种特异性的相似性表明,D2R MSN的集合不太可能在特定环境中抑制所有未选择的动作。因此,到目前为止,数据并不明确支持go/no-go模型的扩展,在该模型中,间接途径比直接途径抑制更广泛的作用。因此,需要新的思路来解释这两种途径的功能。
另一种可能性是,尽管D1R和D2R MSN在同一动作中都是活跃的,但这两种途径的相对激活决定了该动作是被选择还是被避免94–96一个潜在的相关观点是纹状体参与了作为运动输出基础的学习或决策过程,但不直接参与产生运动输出。在这个框架中,D1R和D2R MSN可能对运动输出下的决策变量有相反的表示,尽管在运动期间有类似的激活82,97当与决策相关的内部变量(例如,行为的价值或驱动决策的感官证据)时,可以最好地测试这种可能性98)在决策过程中受参数控制,但在自发行为期间不受参数控制。
为了支持这些观点,最近的证据表明,价值可能会相反地调节这两种途径的活动,尽管这两种途径在运动过程中表现出相似的活动90,91,99例如,在基于价值的决策任务中,许多D1R MSN在奖励呈现期间增加了活动90而D2R MSN在无回报的结果中更为活跃90,100(). 在巴甫洛夫条件反射任务中也观察到相反的结果依赖性反应;这里,D1R和D2R MSN对奖励线索的反应分别与奖励价值呈正相关或负相关99D1R和D2R MSN的活动似乎受值的不同调节,这一事实表明,这些神经元可能对行为决策的内部变量进行相反的编码,而不是对行为本身进行编码。
D1R或D2R MSN的特定光遗传操作进一步支持了这样的观点,即D1R MSN和D2R MSNs相反地调节决策,而不是影响运动输出(). 接受概率反转学习任务训练的动物如果能够获得奖励,则倾向于重复先前选择的动作,如果没有,则会切换90,101,102在小鼠执行其选择的动作之前短暂刺激D1R MSN或D2R MSN,分别诱导对侧或同侧偏倚。这不仅仅是一种运动效应,因为偏差取决于两个可用选项的估计值的差异,因此当两个选项的估计价值更接近时,偏差更大102(). 此外,在结果呈现期间刺激D1R MSN会减少奖赏后的转换,而刺激D2R MSN则会增加未奖赏试验后的转换。这表明这些途径中的结果期活动调节了动物的结果依赖性决策策略90.
直接和间接途径的激活似乎也相反地调节学习。背侧纹状体中D1R MSN的激活增强了与刺激相关的行为或空间位置103并能强化训练动作的特定特征,如速度104.D2R MSN激活具有相反的效果:降低刺激配对行为的表现,诱导对空间位置的厌恶,减少对特定运动速度的选择103,104同样,刺激NAc中的D1R MSN会增加可卡因条件性位置偏爱(CPP),而刺激D2R MSN则会降低可卡因CPP105.
因此,来自视基因激活的大量支持表明,D1R和D2R神经元对学习和决策施加拮抗控制。然而,最近的研究也表明,间接途径具有令人惊讶的功能,这似乎与“不去”完全不同。例如,在感官go/no-go任务中,D1R MSN或D2R MSN的激活会导致对go反应的偏见,而感官信息的感知没有改变106D1R MSN激活后go反应的增加与直接通路功能的经典模型一致;然而,根据经典模型,D2R MSN刺激预计会减少而不是增加go反应。类似地,D1R MSN的光遗传抑制减缓了动作启动,这与经典模型一致,而D2R MSN抑制并没有加快动作启动,反而增加了小鼠脱离任务的概率89,107.
此外,尽管在DMS中直接和间接途径的活性相反地调节强化103DLS或NAc似乎并非如此。DLS中的D2R MSN激活不会减少按下刺激配对杆,而是增加按下配对杆和未配对杆108在NAc中,激活D1R或D2R MSN会促进自我刺激,尽管只有D1R刺激会增加在模拟空间位置的时间109此外,在一项旨在测试动机的任务中,刺激NAc中的D1R或D2R MSN会增加动机,而抑制D2R MSNs会降低动机,导致动物比对照组更早放弃110(但请参见REF111,112). 综上所述,这些研究表明,在某些条件下,间接途径可能具有完全出乎意料的作用,这些作用似乎与经典提出的拮抗直接途径功能的作用大不相同。间接途径在什么时候以及为什么发挥这些意料之外的作用尚待了解。