总结
图形摘要
![保存图片、插图等的外部文件。对象名称为nihms-1646306-f0008.jpg 保存图片、插图等的外部文件。对象名称为nihms-1646306-f0008.jpg](/pmc/articles/PMC7736562/bin/nihms-1646306-f0008.jpg)
ETOC公司:
引言
结果
使用虚拟现实将RPE与价值分离
![保存图片、插图等的外部文件。对象名为nihms-1646306-f0001.jpg 保存图片、插图等的外部文件。对象名为nihms-1646306-f0001.jpg](/pmc/articles/PMC7736562/bin/nihms-1646306-f0001.jpg)
多巴胺信号增强与RPE一致
![保存图片、插图等的外部文件。对象名称为nihms-1646306-f0002.jpg 保存图片、插图等的外部文件。对象名称为nihms-1646306-f0002.jpg](/pmc/articles/PMC7736562/bin/nihms-1646306-f0002.jpg)
![保存图片、插图等的外部文件。对象名称为nihms-1646306-f0003.jpg 保存图片、插图等的外部文件。对象名称为nihms-1646306-f0003.jpg](/pmc/articles/PMC7736562/bin/nihms-1646306-f0003.jpg)
VS中的多巴胺轴突对感觉意外没有反应
![保存图片、插图等的外部文件。对象名为nihms-1646306-f0004.jpg 保存图片、插图等的外部文件。对象名为nihms-1646306-f0004.jpg](/pmc/articles/PMC7736562/bin/nihms-1646306-f0004.jpg)
多巴胺神经元的尖峰活性表现出与RPE一致的斜坡
![保存图片、插图等的外部文件。对象名称为nihms-1646306-f0005.jpg 保存图片、插图等的外部文件。对象名称为nihms-1646306-f0005.jpg](/pmc/articles/PMC7736562/bin/nihms-1646306-f0005.jpg)
VTA中的体钙和VS中的多巴胺浓度与RPE一致
提示奖励接近可以导致多巴胺斜坡与RPE一致
![保存图片、插图等的外部文件。对象名称为nihms-1646306-f0007.jpg 保存图片、插图等的外部文件。对象名称为nihms-1646306-f0007.jpg](/pmc/articles/PMC7736562/bin/nihms-1646306-f0007.jpg)
讨论
实验设计、解释和限制
多巴胺信号斜坡的起源和状态不确定性的潜在作用
多巴胺信号多样性的层次结构
STAR方法
资源可用性
潜在联系人
材料可用性
数据和代码可用性
实验模型和受试者详细信息
老鼠
方法详细信息
手术和病毒注射
VS中GCaMP信号的纤维荧光测定手术。
VTA中GCaMP信号的纤维荧光测定手术。
狂犬病解剖追踪和GCaMP荧光测定手术。
多巴胺传感器信号的光纤荧光测量手术。
光标记多巴胺神经元的单单位记录手术。
虚拟现实设置
开环设置下的虚拟直线轨迹实验
目标任务的标准方法。
实验1(传送到同一目的地并暂停)。
长传送 :当动物到达预定位置(40 a.u.)时,它被传送到靠近奖励的位置(70 a.u.。)。 在传送时,屏幕被短暂地(93毫秒)屏蔽为黑色。 短距离传送 :当动物到达另一预定位置(65 a.u.)时,它被传送到同一目的地(70 a.u.。)。 暂停 :当动物到达目的地(上午70点)时,场景的行进暂停5秒,然后场景移动恢复。
实验2(三遥任务)。
实验3(速度操纵)。
实验4(动态速度操纵)。
实验5a(轨道间传送)。
实验5b(轨道传送和正向传送之间)。
实验5c(不同奖励金额的轨道间远程传送)。
实验6(前后传送)。
闭环环境下的虚拟线性轨道实验
培训标准接近目标任务。
带有气味提示的延迟奖励任务
移动条任务
标准任务。
实验1移动横杆:两次传送和一次暂停任务。
移动条实验2:三个远程任务。
实验三:速度操纵任务。
动物数量和训练历史
实验动物总结
光纤荧光法(光度法)
电生理学
组织学
量化和统计分析
理论背景
定义。
多巴胺神经元被预测未来奖赏的线索所兴奋。 在TD模型中,之所以会出现这种情况,是因为奖赏提示表明提示时的值大于最初的预期值(即动物现在期望奖赏即将到来)。 当一个预测的奖励被忽略时,多巴胺神经元会暂时将其放电降低到基线以下。 在TD模型中,这是因为忽略奖励时的价值现在低于最初的预期。 未经预测的奖励会刺激多巴胺神经元。 然而,当一个线索预测到奖赏的传递时,多巴胺神经元对预测奖赏的反应会大大降低。 在TD模型中,这是因为由于收到奖励而产生的激励被2中的负面响应抵消了。
斜坡条件。
定量分析
荧光测定法(光度法)。
舔和移动。
多巴胺渐变(渐变R)。
会话平均时间进程。
人口平均时间进程。
使用归一化峰值总结响应。
基于状态值模型的剩余响应。
总结响应的变化(ΔF/F差异)。
总结单个单元数据的响应。
根据峰值数据估计GCaMP信号。
总结测试条件下的响应(测试R)。
统计分析。
跨段斜坡R分析。
模型拟合
模型拟合数据和核的预处理。
模型拟合程序。
TD模型,指数 , p0=[0.96 0.96 25 0]; LB=[0.8 0.8 1−2]; UB=[1 1 150 2]; 价值模型,指数 p0=[0.96 0.60]; LB=[0.8 0−2]; UB=[1 10 2]; 价值模型,时间回报( τ , β 1 , β 0 ) p0=[0.5 0.60]; LB=[0.1 0−2]; UB=[1 10 2]; TD-值混合模型,指数 p0=[0.96 0.96 25 0 0.5]; 磅=[0.8 0.8 0.005−2 0]; UB=[1 1 500 2 1]; 指数分数导数模型( τ , β 1 , β 0 , α ), p0=[0.95 0.6 0 0.5]; LB=[0.8 0−2 0]; UB=[1 200 2 2];
关于拟合值函数形状的注释
补充材料
1
2
三
4
5
6
7
致谢
脚注
参考文献
Akaike H(1973)。 信息论作为Petrov BN和Csaki F(Eds.)中最大似然原理的扩展 第二届信息理论国际研讨会 (布达佩斯:Akadémiai Kiadó),第267-281页。 [ 谷歌学者 ] Aronov D和Tank DW(2014)。 啮齿动物虚拟现实系统中二维空间导航的神经电路参与 . 神经元 84 , 442–456. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Babayan BM、Uchida N和Gershman SJ(2018年)。 多巴胺系统中的信念状态表征 . 自然通信 9 , 1891. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Bäckman CM、Malik N、Zhang Y、Shan L、Grinberg A、Hoffer BJ、Westphal H和Tomac AC(2006年)。 表达多巴胺转运体基因座3'非翻译区Cre重组酶的小鼠菌株的特性 . 起源 44 , 383–390. [ 公共医学 ] [ 谷歌学者 ] 拜耳HM和Glimcher PW(2005年)。 中脑多巴胺神经元编码定量奖赏预测错误信号 . 神经元 47 , 129–141. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Bellman R(1954)。 动态规划理论 . 牛市。 阿默尔。 数学。 Soc公司 60 , 503–515. [ 谷歌学者 ] Berke JD(2018)。 多巴胺是什么意思? 自然神经科学 21 , 787–793. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Bromberg-Martin ES、Matsumoto M和Hikosaka O(2010年)。 外侧缰核和多巴胺神经元的不同强直和时相预期活动 . 神经元 67 , 144–155. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Brunton SL、Proctor JL和Kutz JN(2016)。 非线性动力系统稀疏辨识从数据中发现控制方程 . 美国国家科学院 113 , 3932–3937. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Cachope R、Mateo Y、Mathur BN、Irving J、Wang H-L、Morales M、Lovinger DM和Cheer JF(2012年)。 胆碱能中间神经元的选择性激活增强伏隔相多巴胺的释放:为奖赏处理设定基调 . 单元格代表 2 , 33–41. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Chen G、King JA、Burgess N和O'Keefe J(2013a)。 视觉和运动如何在海马体位置码中结合 . 美国国家科学院 110 , 378–383. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Chen T-W、Wardill TJ、Sun Y、Pulver SR、Renninger SL、Baohan A、Schreiter ER、Kerr RA、Orger MB、Jayaraman V等(2013b)。 用于神经活动成像的超灵敏荧光蛋白 . 性质 499 , 295–300. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Clark JJ、Hollon NG和Phillips PEM(2012年)。 巴甫洛夫学习和决策评估系统 . 货币。 操作。 神经生物学 22 , 1054–1061. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Cohen JY、Haesler S、Vong L、Lowell BB和Uchida N(2012)。 腹侧被盖区奖惩神经元类型特异性信号 . 性质 482 , 85–88. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Cox J和Witten IB(2019年)。 奖励学习和决策的纹状体电路 . 国家神经科学评论 20 , 482–494. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Dabney W、Kurth-Nelson Z、Uchida N、Starkweather CK、Hassabis D、Munos R和Botvinick M(2020年)。 基于多巴胺的强化学习中的价值分配码 . 性质 577 , 671–675. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Dombeck DA、Khabbaz AN、Collman F、Adelman TL和Tank DW(2007年)。 用细胞分辨率成像清醒、活动小鼠的大规模神经活动 . 神经元 56 , 43–57. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Engelhard B、Finkelstein J、Cox J、Fleming W、Jang HJ、Ornelas S、Koay SA、Thiberge SY、Daw ND、Tank DW等人(2019年)。 VTA多巴胺神经元中感觉、运动和认知变量的专门编码 . 性质 570 , 509–513. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Eshel N、Bukwich M、Rao V、Hemmelder V、Tian J和Uchida N(2015)。 多巴胺预测错误背后的算法和局部电路 . 性质 525 , 243–246. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Farasat N、Costa KM、Stojanovic S、Albert S、Kovacheva L、Shin J、Egger R、Somayaji M、Duvarci S、Schneider G等人(2019年)。 确定轴突投射内中脑多巴胺神经元的体内功能多样性 . 埃利夫 8 . [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Fiorillo CD、Newsome WT和Schultz W(2008)。 多巴胺神经元奖赏预测的时间精度 . 自然神经科学 11 , 966–973. [ 公共医学 ] [ 谷歌学者 ] Franklin KB和Paxinos G(2008)。 立体定向坐标系下的小鼠大脑 (爱思唯尔学术出版社; 圣地亚哥:)。 [ 谷歌学者 ] Gershman SJ(2014)。 多巴胺斜坡是奖励预测错误的结果 . 神经计算 26 , 467–471. [ 公共医学 ] [ 谷歌学者 ] Gershman SJ和Uchida N(2019年)。 相信多巴胺 . Nat Rev神经科学 1–12. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Gibbon J、Malapani C、Dale CL和Gallistel CR(1997年)。 走向时间认知的神经生物学:进展与挑战 . 神经生物学的当前观点 7 , 170–184. [ 公共医学 ] [ 谷歌学者 ] 上师A、Seo C、Post RJ、Kullakanda DS、Schaffer JA和典狱长MR(2020年)。 中脑多巴胺神经元活动增强表明认知地图的使用 . 生物Rxiv 2020.05.21.108886. [ 谷歌学者 ] Hamid AA、Pettibone JR、Mabrouk OS、Hetrick VL、Schmidt R、Vander Weele CM、Kennedy RT、Aragona BJ和Berke JD(2016)。 中边缘区多巴胺是工作价值的信号 . 自然神经科学 19 , 117–126. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Hamid AA、Frank MJ和Moore CI(2019年)。 多巴胺波作为时空信贷分配机制 . 生物Rxiv 729640 [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Harvey CD、Collman F、Dombeck DA和Tank DW(2009年)。 虚拟导航中海马位置细胞的细胞内动力学 . 性质 461 , 941–946. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Howe MW和Dombeck DA(2016)。 运动和奖赏期间不同多巴胺能轴突的快速信号 . 性质 535 , 505–510. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Howe MW、Tierney PL、Sandberg SG、Phillips PEM和Graybiel AM(2013年)。 纹状体中多巴胺信号的延长表示远距离奖赏的接近和价值 . 性质 500 , 575–579. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Ikemoto S(2007)。 多巴胺奖赏回路:从中脑腹侧到伏隔核-嗅结节复合体的两个投射系统 . 大脑研究综述 56 , 27–78. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Killeen PR和Fetterman JG(1988年)。 计时行为理论 . 精神病Rev 95 , 274–295. [ 公共医学 ] [ 谷歌学者 ] Kim HR、Angelaki DE和DeAngelis GC(2015年)。 基于运动视差的MT神经元与深度知觉的功能联系 . 神经科学杂志 35 , 2766–2777. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Kobayashi S和Schultz W(2008年)。 奖励延迟对多巴胺神经元反应的影响 . 神经科学杂志 28 , 7837–7846. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Kremer Y、Flakowski J、Rohner C和Lüscher C(2020年)。 个体VTA多巴胺神经元的上下文依赖性多路复用 . 神经科学杂志 40 , 7489–7509. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Kvitsiani D、Ranade S、Hangya B、Taniguchi H、Huang JZ和Kepecs A(2013)。 前额叶皮层两种中间神经元类型的不同行为和网络相关性 . 性质 498 , 363–366. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Lammel S、Hetzel A、Häckel O、Jones I、Liss B和Roeper J(2008)。 双中脑皮质边缘多巴胺系统中脑前额叶神经元的独特特性 . 神经元 57 , 760–773. [ 公共医学 ] [ 谷歌学者 ] Lima SQ、Hromádka T、Znamenskiy P和Zador AM(2009年)。 PINP:一种标记神经元群的新方法,用于体内电生理记录中的识别 . 公共科学图书馆 4 ,e6099。 [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Lloyd K和Dayan P(2015)。 夯实斜坡:Accumbens中相态多巴胺信号的算法、实现和计算解释 . 公共科学图书馆计算。 生物 11 ,e1004622。 [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Ludvig EA、Sutton RS和Kehoe EJ(2008年)。 多巴胺系统模型中刺激表征和奖惩错误的时间 . 神经计算 20 , 3034–3054. [ 公共医学 ] [ 谷歌学者 ] Madisen L、Zwingman TA、Sunkin SM、Oh SW、Zariwala HA、Gu H、Ng LL、Palmiter RD、Hawrylycz MJ、Jones AR等(2010年)。 一种用于小鼠全脑的强大且高通量的Cre报告和表征系统 . 自然神经科学 13 , 133–140. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Menegas W、Babayan BM、Uchida N和Watabe-Uchida M(2017年)。 小鼠腹侧和后纹状体多巴胺信号新线索的反向初始化 . ELife科学 6 ,e21886。 [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Menegas W、Akiti K、Amo R、Uchida N和Watabe-Uchida M(2018年)。 投射到后纹状体的多巴胺神经元加强了对威胁性刺激的回避 . 自然神经科学 21 , 1421–1430. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Mikhael JG,Kim HyungGoo。 R.、Uchida N和Gershman SJ(2019年)。 多巴胺信号的激增和状态不确定性 . 生物Rxiv [ 谷歌学者 ] Mohebi A、Pettibone JR、Hamid AA、Wong J-MT、Vinson LT、Patriarch T、Tian L、Kennedy RT和Berke JD(2019年)。 学习和动机的可分解多巴胺动力学 . 性质 570 , 65–70. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Morita K和Kato A(2014)。 纹状体多巴胺激增可能表明皮质-基底神经节回路中具有遗忘功能的灵活强化学习 . 前部神经电路 8 , 36. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Niv Y(2009)。 大脑中的强化学习 . 数学心理学杂志 53 , 139–154. [ 谷歌学者 ] Parker NF、Cameron CM、Taliaferro JP、Lee J、Choi JY、Davidson TJ、Daw ND和Witten IB(2016)。 中脑多巴胺神经元终末的奖赏和选择编码依赖于纹状体靶点 . 自然神经科学 19 , 845–854. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Phillips PEM、Stuber GD、Heien MLAV、Wightman RM和Carelli RM(2003年)。 亚秒级多巴胺释放促进可卡因寻求 . 性质 422 , 614–618. [ 公共医学 ] [ 谷歌学者 ] 波德鲁布尼一世(1998)。 分数微分方程:分数导数、分数微分方程、其求解方法及其应用简介 (圣地亚哥:学术出版社;)。 [ 谷歌学者 ] Roitman MF、Stuber GD、Phillips PEM、Wightman RM和Carelli RM(2004)。 多巴胺是觅食的亚秒调节剂 . 神经科学杂志 24 , 1265–1271. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Schmidt M和Lipson H(2009)。 从实验数据中提取自由形式的自然定律 . 科学类 324 , 81–85. [ 公共医学 ] [ 谷歌学者 ] Schmitzer-Torbert N和Redish AD(2004)。 序贯导航中啮齿动物背侧纹状体的神经元活动:多重T任务空间和奖赏反应的分离 . 神经生理学杂志 91 , 2259–2272. [ 公共医学 ] [ 谷歌学者 ] 舒尔茨W(2019)。 相态多巴胺活性作用的研究进展 . F1000分辨率 8 , 1680. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Schultz W、Dayan P和Montague PR(1997年)。 预测和奖励的神经基质 . 科学类 275 , 1593–1599. [ 公共医学 ] [ 谷歌学者 ] Stalnaker TA、Howard JD、Takahashi YK、Gershman SJ、Kahnt T和Schoenbaum G(2019年)。 多巴胺神经元群表示感觉预测误差的含量 . 埃利夫 8 . [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Starkweather CK、Babayan BM、Uchida N和Gershman SJ(2017年)。 多巴胺奖赏预测误差反映了跨时间的隐藏状态推断 . 自然神经科学 20 , 581–589. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] 萨顿RS(1988)。 学习通过时间差异的方法进行预测 . 马赫数学习 三 , 9–44. [ 谷歌学者 ] Sutton RS和Barto AG(1998年)。 强化学习:简介 (马萨诸塞州剑桥:麻省理工学院出版社;)。 [ 谷歌学者 ] Takahashi YK、Batchelor HM、Liu B、Khanna A、Morales M和Schoenbaum G(2017年)。 多巴胺神经元对预期回报感觉特征预测错误的反应 . 神经元 95 , 1395–1405. e3。 [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Threlfell S、Lalic T、Platt NJ、Jennings KA、Deisserth K和Cragg SJ(2012年)。 纹状体多巴胺释放由胆碱能中间神经元的同步活动触发 . 神经元 75 , 58–64. [ 公共医学 ] [ 谷歌学者 ] Tsai H-C、Zhang F、Adamantidis A、Stuber GD、Bonci A、de Lecea L和Deisseroth K(2009)。 多巴胺能神经元的相控放电足以进行行为调节 . 科学类 324 , 1080–1084. [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Uchida N和Mainen ZF(2003年)。 大鼠嗅觉辨别的速度和准确性 . 自然神经科学 6 , 1224–1229. [ 公共医学 ] [ 谷歌学者 ] Watabe Uchida M和Uchida N(2019)。 多多巴胺系统:多巴胺的灾难 . 冷泉港。 交响乐团。 数量。 生物 [ 公共医学 ] [ 谷歌学者 ] Watabe-Uchida M、Eshel N和Uchida N(2017年)。 报酬预测误差的神经电路 . 每年。 神经科学评论 [ PMC免费文章 ] [ 公共医学 ] [ 谷歌学者 ] Zhou FM、Liang Y和Dani JA(2001)。 内源性烟碱胆碱能活性调节纹状体多巴胺释放 . 自然神经科学 4 , 1224–1229. [ 公共医学 ] [ 谷歌学者 ]