1. 摘要
动物必须不断地评估其环境中的刺激,以决定追求哪些机会,在许多情况下,这些决定可以从根本上的经济角度来理解。虽然几个大脑区域单独参与了这些过程,但与这些区域在决策中相关的全脑机制尚不清楚。通过一种大鼠的经济决策任务,我们发现两个连接的大脑区域,即腹外侧眶额皮层(OFC)和背内侧纹状体(DMS)的神经活动是经济决策所必需的。这两个大脑区域的相关神经活动惊人地相似,主要是由决策过程的空间特征决定的。然而,OFC中选择方向的神经编码先于DMS,并且这种时间关系与选择的准确性密切相关。此外,为了进行适当的经济决策,还需要特别开展OFC预测DMS的活动。这些结果表明,OFC中的选择信息被传递到DMS,以引导准确的经济决策。
2. 引言
经济决策,即评估环境中各种选择的过程,以提供最佳行动方针的信息,对对生存和福祉至关重要的各种行为至关重要。为了做出最佳决策,每个选项的神经表征必须与它所预测的结果的类型和规模的信息相结合,以提供每个选项的主观价值的表征。然后,在参与产生灵活行为反应的神经回路之前,可以比较主观价值的表征。
在眶额皮层(OFC)中已经发现了主观价值的神经表征,而OFC的微电刺激会影响选择行为。这些结果支持了一个广泛的假设,即OFC在经济决策中起着作用。然而,OFC的病变和失活在选择行为上产生了相互矛盾的结果。此外,主观价值的表征存在于其他大脑区域,包括内侧前额叶皮层、背内侧纹状体(DMS)和背侧丘脑;这些大脑区域的相似操作会影响决策行为。因此,多个大脑区域可能在经济决策中发挥重要作用;然而,令人惊讶的是,人们对这些大脑区域是否以及如何相互作用以调节经济选择知之甚少。这种有限理解的一个原因是,大多数研究基于价值的决策的神经相关性的研究都是在非人类灵长类动物系统中进行的,在这些系统中,在记录和操纵精确定义的神经元种群的活动方面,工具的限制更大。为了解决这一限制性,我们为大鼠调整了一项经济决策任务,它允许在大鼠做出经济决策时,记录和操纵多个已定义的神经种群的神经活动。
3. 结果
3.1 经济决策过程中奖励数量与质量信息的整合
在最初的实验中,我们在大鼠身上开发并验证了一个经济决策任务(图1a)。在每次试验中,大鼠被并排呈现两个视觉线索。刺激的类型(垂直的或水平漂移光栅)表示相关奖励的身份(黑醋栗味或柠檬味)的水,视觉刺激的大小表示相关奖励的大小。2秒后,动物可以在所选择的提示的一侧用鼻子戳来表明选择,然后传递所选择的奖励。我们发现,大鼠可靠地选择了预测更大体积奖励的视觉刺激(图1b,c)。此外,与可用奖励量差异较小的试验(困难试验)相比,动物在可用奖励量差异较小的试验中表现出较慢的选择延迟(图1d)。确认动物做决策基于刺激的价值,而不是简单地检测更大的视觉线索更可靠,我们包括一个子集的动物视觉刺激的大小不是正相关的奖励预测的大小。这些动物仍然可靠地选择了预测更大体积奖励的刺激,这表明动物使用的信息可做出适当决定的可用奖励量。
我们接下来询问动物除了奖励量的信息外,是否使用关于奖励身份的信息来指导它们的决策。对于每一种动物,我们通过计算可用奖励的差异(黑加仑味水的数量−柠檬味水的数量)来生成一个偏好分数,在这个分数下,动物选择黑加仑预测线索或柠檬预测线索。我们发现,个体动物对黑加仑预测线索或柠檬预测线索表现出适度的偏好(图1e)。此外,我们发现个体动物的偏好得分在连续的阶段以及间隔约4个月的阶段(图1f)之间有很强的相关性。因此,个体动物的果汁偏好在短时间尺度和长时间尺度上都是稳定的。因此,动物整合了个体(主观)关于可用奖励质量的内部偏好和外部可获得的可用奖励数量(客观)信息,以做出经济决策。
图1. 大鼠整合关于奖励数量和奖励身份的信息来做出经济决策。a,老鼠的经济决策任务示意图。b, 所有线索组合选择黑加仑预测提示的概率(n = 42只大鼠,单因素重复测量方差分析(ANOVA))。c,选择黑加仑预测线索的概率,作为可用奖励大小差异的函数。大鼠更有可能选择更大的可用奖励(n = 42只大鼠,单向重复测量方差分析)。d,选择延迟鼻子反应作为可用奖励大小差异的函数。当奖励量的差异较大时,大鼠的速度更快(简单的试验)(n=42只大鼠,单向重复测量方差分析)。中心的点表示中位数,条形图表示第一和第三个四分位数。e,偏好得分直方图:动物选择黑加仑预测或柠檬预测线索的可用奖励的差异(负值,蓝色阴影:大鼠喜欢黑加仑;正值,黄色阴影:大鼠喜欢柠檬;42只大鼠)。f,在间隔4个月的疗程中计算的偏好得分的相关性。偏好得分高度相关,表明个体动物的果汁偏好在时间上是稳定的(n = 12只大鼠,皮尔逊相关)。*P < 0.05, ***P < 0.001.
3.2 OFC和DMS的活动对经济决策都是必要的
电生理记录确定了几个大脑区域,它们似乎编码了经济决策任务的重要特征。为了确定哪些大脑区域对这项任务至关重要,我们进行了光遗传失活筛选。具体来说,在大鼠达到标准表现(方法)后,我们将人类突触蛋白启动子(AAV8 hSyn:SwiChR EYFP)控制抑制稳定视蛋白SwiChR 25的腺相关病毒(AAV)注射到双侧OFC、DMS、背侧丘脑或前边缘皮层,并将光纤放置在这些结构的上方(图2a)。当动物重新建立了标准表现时,我们询问了对这些大脑结构的光学抑制是否会改变决策表现(图2b)。
根据之前在小鼠中的研究结果,OFC的光遗传抑制损害了经济决策。我们发现,心理测量曲线更平坦,容易选择的潜伏期较慢(图2c,d)。此外,我们发现,在OFC被抑制的试验中计算的偏好与在OFC未被抑制的试验中计算的偏好并不相关,这表明OFC的光遗传抑制也破坏了果汁偏好(图2e)。DMS的光遗传抑制也损害了经济决策;心理测量曲线较平坦,容易选择的潜伏期较慢,但选择偏好没有变化(图2i-k),这表明基于奖励量的决策被破坏了,但果汁偏好保持完整。相比之下,对前边缘皮层(图2f-h)或中背侧丘脑(图2l-n)的光遗传抑制对经济决策都没有明显的影响。在注射了编码增强黄色荧光蛋白(EYFP)的对照病毒的动物中,并接受了相同的程序后,决策结果也没有改变。
确定我们观察到的影响是归因于特定的经济决策赤字或由于一个意想不到的非特定效果的干预(如视觉感知、行动执行或价值回忆),我们把相同的动物放在控制任务,经济决策任务的选择组件被删除。在不受抑制的试验中,动物对预测更大容量奖励的线索做出的反应更快,这表明动物可以感知这些线索,记住它们的价值,并做出相应的行动。重要的是,当OFC或DMS被抑制时,这种关系一直保持不变。因此,抑制OFC或DMS会损害经济决策,而不损害视觉感知、动作执行或线索价值的表征(或回忆)。
图2.OFC和DMS的活动对经济决策很重要。左图:准备工作示意图。右:在光刺激下显示抑制峰值活动的例子。b,仅限于线索评价周期的光抑制选择任务示意图。c-n、OFC和DMS的抑制会损害经济决策。c、f、i、l,选择黑加仑预测线索的概率,作为未受抑制(绿色)和受抑制(洋红色)试验的可用奖励量差异的函数。当OFC (c)或DMS (i)被抑制时,大鼠不太可能选择更大的体积奖励,但当前边缘皮层(f)或中背侧丘脑(l)被抑制时,则不太可能选择更大的体积奖励(OFC:n=12大鼠;前边缘皮层:n=7大鼠;DMS:n=6大鼠;中背丘脑:n=6大鼠;双向重复测量方差分析)。插图,动物在未受抑制(绿色)和受抑制(洋红色)试验(试验)中选择更大的可用奖励的试验(双侧配对t检验)的比例。d、g、j、m,不受抑制的鼻子选择反应的延迟作为不受抑制(绿色)和受抑制(洋红色)试验中奖励大小的绝对差异的函数。在OFC (d)或DMS (j)的实验中,大鼠反应较慢(OFC:n = 12大鼠:前边缘皮层:n=7大鼠;DMS:n=6大鼠;背侧丘脑:n=6大鼠,双向重复测量方差分析)。对前边缘皮层(g)或背内侧丘脑(m)的抑制都没有改变反应潜伏期。e、h、k、n,在OFC (e)被抑制的试验中计算的果汁偏好与在OFC未被抑制的试验中计算的果汁偏好不相关(Pearson相关)。抑制前边缘皮层(h)、DMS (k)或中背侧丘脑(n)并没有改变人们对果汁的偏好。*P < 0.05, **P < 0.01, ***P < 0.001.
3.3 OFC中的选择相关活动先于DMS中的选择相关活动
为了更详细地探索这些脑区在经济决策中可能具有什么功能,我们在自由运动的大鼠的OFC和DMS中进行了无线细胞外电生理记录。在两个脑区分解的所有单位中发现了很大比例的任务调节单个单位(OFC:1329个单位中的1157只,n = 6只大鼠;DMS:656个单位中的524个,n = 6只大鼠)。在这两个区域中,试验平均的单个单元活动跨越了试验,并确定了由一系列任务特征调制的单个单元(图3a,b)。我们观察到惊人的相似性在神经编码和DMS,单一反应由任务的空间特征在大脑区域。有趣的是,符合我们的失活数据,我们观察到,尽管相似比例的神经元编码客观值(大小)和主观价值预测奖励的动物,神经元更强烈调制的主观价值比刺激的客观价值,影响没有观察到DMS。
为了表征OFC和DMS之间编码的时间动态,我们训练了一个线性支持向量机(SVM),从OFC或DMS中记录的神经活动数据中解码动物在每次试验中所做的选择(图3d)。我们能够对来自两个大脑区域的保留的神经活动数据进行高精度的解码选择方向。重要的是,在所有动物中,选择预测在OFC中达到峰值,然后在DMS中达到峰值(图3e)。接下来,我们研究了这种时间关系是如何与选择的准确性相关的。互相关联的预测选择参数(解码决策值的垂直距离支持向量,代理决策信心)计算单个试验显示,OFC导致DMS试验更大的奖励(动物选择正确的试验)比动物选择更小的奖励(错误试验)(图3f)。这些数据表明,OFC中选择相关信息的编码先于DMS中选择相关信息的编码,并且这种关系与选择的准确性相关。
为了检验OFC和DMS之间的信息传递如何在错误试验中被破坏,我们首先询问在动物选择更大的奖励的SVM是否可以预测动物选择较小的奖励的试验中的选择行为。引人注目的是,一个模型训练数据记录从OFC或DMS正确试验预测的动物会选择同样在正确和不正确的试验,表明大脑区域编码的选择相同的准确性不管选择的正确性。我们接下来检查了SVM的预测选择。在动物做出正确或不正确选择的持续试验中计算出的参数。与之前一样,在正确的试验中,我们观察到,在DMS之前,OFC的预测选择参数增加了。然而,当动物做出错误的选择时,我们观察到,尽管预测的选择参数达到了与正确试验相似的水平,但在DMS之前,OFC的预测选择参数并没有增加。因此,当空间选择信息从OFC传输到DMS时对于启动适当的基于价值的选择行为是必要的,如果没有这种信息,选择可能是由其他反映与习惯性行为相关的内部偏差的大脑区域启动的。
图3.OFC和DMS的活动编码了经济决策的空间特征。a,上:OFC(上)或DMS(下)中每个任务调制单元的z分数发射率的热图,在所有试验中取平均值。较低的是:人口平均z得分的射击率。b,调整OFC(顶部)或DMS(下)中记录的单个单元。左图:试验平均刺激周围时间直方图。右图:峰值z分数的小提琴图。不同深浅的蓝色和红色对应着不同的试验类型。中心的点代表中位数;条形图表示第一和第三个四分位数。c,OFC(上)或DMS(下)中受不同任务特征显著调节的单位比例。OFC和DMS的活动特性同样由空间特征所支配。d,线性解码方法。e,在OFC(蓝色)或DMS(红色)中进行单个单元活动训练的四倍交叉验证SVM的选择侧分类精度。OFC中解码精度的提高先于DMS中解码精度的提高(6只大鼠每个脑区n=656个单位)。f,左:在单个试验中计算出的预测选择参数,其中OFC(顶部)和DMS(底部)的活动同时被记录下来。预测的选择参数定义为解码后的决策值与支持向量的垂直距离。预测的选择参数与选择反应对齐,并根据动物在每次试验中选择的一侧进行颜色编码。右:预测选择参数的直方图时选择表示(n = 132试验,n=11=单位,n = 11 DMS单位)g,单阶段平均峰值互相关滞后和DMS预测选择参数试验的动物选择更大的奖励(正确的试验,绿色)和试验的动物选择较小的奖励(错误的试验,灰色)(n=来自5只老鼠,双侧配对t检验;黑线表示平均值)。**P < 0.01.
3.4 OFC对DMS的预测活动对经济决策是必要的
OFC和DMS中的选择相关信息之间的时间关系表明,OFC中所代表的选择可以传递到DMS,以指导适当的选择行为。为了解决这一假设,我们首先检查了来自OFC的轴突投射,并证实了在DMS26上存在一个稳健的投影(图4a,b)。接下来,我们通过将人类突触素启动子(AA8 hSyn:eNpHR3.0-NRN-EYFP)的控制下,双侧抑制OFC,优化了轴突运输(图4c,d)。我们将光纤两侧定位在DMS或背丘脑中,这是OFC投射的另一个主要目标(图4b)。我们发现光遗传抑制OFC输入到DMS选择性受损决策与奖励体积:心理测量曲线平坦和选择延迟中断(图4e,f),而偏好得分不变,表明抑制OFC投影DMS没有破坏果汁(图4g)。相比之下,对背丘脑内侧的OFC输入的光遗传抑制对经济决策没有影响(图4h-j)。此外,光遗传抑制的OFC投影DMS或中背丘脑没有影响反应延迟的控制任务的选择组件的经济决策任务被选择性地消除,确认这种操作不损害视觉感知、行动执行或表示(或回忆)的提示值。综上所述,本研究中显示的数据表明,直接从OFC直接传递到DMS的信息对于指导经济决策非常重要。
图4. 从OFC到DMS的预测活动对经济决策是必要的。a,有代表性的完整大鼠大脑在清除前(左)和(中)清除后的完整大鼠大脑的照片。b,OFC3大鼠OFC中表达红细胞体的全脑轴突投射的定量。c,在经济决策过程中抑制OFC轴突终末的手术准备示意图。d,在经济决策任务的线索评价期间的光抑制示意图。e-j,抑制OFC对DMS的投射,而不是OFC对内侧背丘脑的投射,会损害经济决策。e,h,选择黑加仑预测线索的概率,作为未受抑制(绿色)和受抑制(洋红色)试验的可用奖励量差异的函数。当OFC对DMS的投射受到抑制时,大鼠不太可能选择更大的体积奖励(e),但当OFC对背丘脑内侧的投射被抑制时(h)则不太可能选择(OFC-DMS:n = 7大鼠;OFC-背侧丘脑:n = 6大鼠,双向重复测量方差分析)。f,i,作为未受抑制的(绿色)和受抑制的(洋红色)试验的奖励大小的绝对差异的函数。当奖励量的差异很高和OFC对DMS的投射被抑制时,大鼠的反应较慢(f)。抑制OFC向背侧丘脑内侧的投射(i)并没有改变反应潜伏期(OFC-DMS:n = 7大鼠;OFC-MD:n = 6大鼠,双向重复测量方差分析)。g,j,在OFC投射DMS (g)或背丘脑(j)被抑制的试验中计算的果汁偏好与在OFC投射DMS或背丘脑不受抑制的试验中计算的果汁偏好相关(皮尔逊相关)。**P < 0.01, ***P < 0.001.
4. 讨论
动物必须不断地评估其环境中的刺激,以指导适当的接近和回避行为。为了研究大脑的神经活动模式如何调节这些复杂的行为,我们为老鼠调整了一个经济决策任务。我们的实验表明,OFC和DMS的活动对经济决策很重要,但令人惊讶的是,在前边缘皮层或背内侧丘脑中并不重要。此外,这两个大脑区域的神经活动主要是由经济决策任务的空间特征决定的。有趣的是,我们发现与选择相关的活动在DMS之前就出现在OFC中,这种关系与选择的准确性相关。最后,我们发现从OFC到DMS的直接连接的活动对于适当的决策行为是重要的。综上所述,这些数据表明,空间选择信息从OFC传递到DMS,以指导适合个人的经济决策。
先前的几行证据支持了OFC在经济决策中的作用;然而,失活和病变的研究产生了相互矛盾的结果。在本研究中,我们利用时间分辨率,提高了设计的抑制稳定步进的功能敏感性,在线索评估期间,当大鼠做决策时,选择性地抑制OFC。这种光遗传策略避免了长时间的组织加热(可以直接调节神经活动),并防止了在选择执行和奖励消耗过程中OFC的中断(这可能对决策行为产生其他影响)。此外,我们使用了一个新的训练范式暴露对线索仅限于测试环境,所以动物不太可能发展非自然的习惯反应特定的线索组合(这种现象可能导致负面结果观察到一些以前的研究)。这种训练范式产生了精确的心理测量曲线功能,使我们能够发现经济决策中的细微损伤。最后,我们证明了OFC中的活动对于被选择性地去除选择成分的控制任务的执行是不必要的。本实验排除了由光抑制引起的感觉、运动或动机缺陷驱动的可能性。综上所述,这些数据显示,OFC抑制仅限于线索评估期,具体地、有效地损害了适合个人偏好的经济决策。
OFC被认为是一种世界的认知地图,即在环境中存在的联想和预测关系的内部模型。这一假设可以统一一些关于OFC在不同任务中的作用的对比观察结果,在这些任务中,当个人必须使用多个类别的既定知识来指导新场景中的行为时,OFC似乎是特别需要的。与这一假设相一致的是,我们发现,动物必须在不同价值的选项中进行选择时,OFC活动是必要的,这只有以前单独经历过。重要的是,我们观察到OFC抑制似乎并不妨碍获取价值信息的能力;例如,在单线索控制条件下,被OFC抑制的动物仍然对预测更大幅度奖励的线索反应更快。值得注意的是,这也是动物们从未见过的任务。
因此,这些数据表明,动物必须解决动机冲突来指导新的决策时,OFC活动(以及相关的认知地图)是被专门招募的。需要注意的是,OFC是一个大的、异质性的结构,由眶额皮层的内侧、腹侧、腹外侧、外侧和背外侧区域组成。在这项研究中,我们专门针对了腹外侧轨道区域,因为有报道称其在支持灵活行为方面的作用。在未来,确定这些结果如何与其他眶额皮层亚区域的失活相比,以及未来的结果如何与中外侧和前后梯度的解剖连接的既定差异相关联,将是很重要的。
与之前的观察非人类灵长类动物做经济决策,一直证明任务变量代表OFC商品(即资源)空间,我们的数据表明,啮齿动物OFC有一个关键角色在决策行动空间。与这一想法相一致的是,我们观察到与决策相关的变量在大鼠OFC中以一种空间映射的方式表示。此外,虽然OFC的光遗传抑制并不影响单一感觉动物的行为在控制任务中,动物使用相同的单一线索来指导动物在选择任务中的两种不同行为之间的决策时,光遗传抑制会严重损害行为。综上所述,这些数据表明,动物必须在不同价值的行为中做出选择时,啮齿动物的OFC活动是被特别招募的。这将是重要的要确定这反映了一个基本差异处理跨物种或由于特定任务的不同要求使用(例如,本研究中使用的自由移动任务可能需要更详细的表示空间环境的约束任务通常用于非人类灵长类动物)。
与OFC本身的作用相比,OFC输出到其他大脑区域在基于价值的决策中的作用还没有得到那么全面的描述。先前的研究表明,OFC投影腹侧被盖区可以调解适当的信贷分配,投影从外侧或内侧OFC可以调解编码和检索值,和OFC投影背侧和腹侧纹状体是重要的使用结果更新特定行动的价值。在这项研究中,我们扩展了这项工作,首次显示DMS的直接传输信息,该脑区涉及的目标行动是重要的评估不同的奖励选项之前的任何结果。此外,通过证明在我们选择性地消除动机冲突的控制任务中,不需要相同投影的活动,我们证实了决策行为的缺陷不是由于一般未能回忆起特定线索预测的结果。
令人惊讶的是,虽然抑制OFC会破坏了基于奖励大小(客观价值)和奖励类型(主观价值)的选择,但抑制DMS或从OFC到DMS的投射只会破坏基于奖励大小(客观价值)的选择。此外,我们发现OFC中的神经元比客观值更受主观值的调节,而这种效应在DMS中没有观察到。这些数据表明,OFC的另一个途径可能也有助于对不同类型奖励的决策。在未来,重要的是要确定不同的OFC预测如何协同作用,以支持决策的不同组成部分。综上所述,这些数据为了解OFC中编码的选择如何与下游神经回路结合,以产生适当的行为反应提供了新的见解。
经济决策要求动物比较感官刺激的主观价值,以指导适当的行为。为了实现这一目标,感官表征必须注入主观价值信息,进行比较,并用于参与产生适当行为反应的神经回路。在本研究中,我们报道了从OFC到DMS的投影最终将感觉表征与适当的行为输出连接起来,以实现准确的经济决策。因此,OFC对DMS的投射提供了一个关键的解剖基质,皮质表征对正在进行的行为进行动态控制。
5. 方法
5.1 实验动物和立体定向手术
成年(10-12周)雄性和雌性长-Evans大鼠被分组安置直到手术。大鼠被随机分配到不同的实验组。动物被异氟醚(1-5%,Henry Schein)麻醉,并放置在一个立体定向框架(Kopf仪器)。插入骨螺钉(支架公司)。在光遗传学实验中,插入微注射针(WPI)(bregma坐标:OFC 4前后,±2中外侧,−3背腹;边缘皮层 2.5前后,±0.5中外侧,−3.5背腹;DMS 1前后,±2.5中外侧,−4背腹;背丘脑−2.8前后,±0.8,−5背腹;注意背腹坐标反映了与脑表面的距离),每个结构以0.1 μl min的速度注射病毒。将一根直径为200μm的光纤(Thorlabs)放置在目标位置上方250 μm处,并用牙科水泥(RelyX,3M)固定。为了进行电生理记录,64通道硅探针被安装在一个微驱动器上,并将其降低到感兴趣位置上方500 μm。开颅术用硬脑膜凝胶密封,微驱动器用牙科水泥固定。Molex连接器被连接到一个无线头台(白质LLC)上,然后用牙科粘合剂固定在颅骨上。在记录前2天将探头降低到记录地点,给予丁丙诺啡SR(1mgkg−1)。作为排除标准,我们只纳入了病毒表达局限于感兴趣部位和纤维放置在靶部位上方的大鼠。所有实验都按照斯坦福大学批准的方案进行。
5.2 大鼠行为
给水安排的大鼠(每天1小时的水)被放置在一个定制的操作室中,并配备有三个安装在屏幕上的鼻尖入口。中心的入口配备了一个用于奖励传递的舔嘴。通过红外光束的断裂来检测每个鼻孔入口的条目,并使用电容式触摸传感器来检测舔舐。(在电生理记录中,我们省略了这一点。)所有的事件都使用自定义的MATLAB代码进行控制和记录,使用MATLAB的Arduino包和心理物理学工具箱v.3。为了进行训练,动物被放置在操作室中。进入中心门一秒钟后,他们会在中心门的一侧看到一个视觉提示。提示的类型(垂直或水平漂移光栅)表明了与提示相关的奖励类型(零卡路里黑加仑味或柠檬味的水);包含提示的方块数量表示与提示相关的奖励大小。柠檬预测线索和黑加仑预测线索可以出现在动物的左侧或右侧,每次试验都要随机进行。2秒后,动物必须在提示出现的一侧用鼻子戳一下,以获得相应的奖励。奖励在中心传送。奖励收集之后是一个5-10秒的可变试验间隔(ITI)。如果动物对错误的一面做出反应,就不会得到奖励,屏幕在10秒的暂停时间内变成白色。这教会了动物们移动到提示的一侧,以指示反应,并加强偶然性。动物需要超过12秒的时间来表明反应的试验,以及动物需要超过5秒的时间来获得奖励的试验,都被排除在外。
当动物达到标准表现时(> 90%的准确性和反应延迟与奖励大小成反比;每个刺激都被比较学习),它们被放入一个完整的选择阶段。动物被放置入操作室;进入中心门静脉1s后,动物并排呈现两个视觉线索。柠檬预测或黑加仑预测线索可以出现在动物的左侧或右侧,每次试验都要随机进行。2秒后,动物必须移动到所选择的提示的一侧来表明它们的选择,所选择的奖励在中心传送。奖励收集之后是一个5-10秒的变量ITI。动物需要超过12秒来表明选择的试验,以及动物需要超过5秒来获得奖励的试验,都被排除在外。如果动物执行超过75%的准确性(动物做出选择主要是最大化液体消耗总量,准确性被定义为试验的比例在动物选择更大的奖励),第二天动物被放到另一个完整的选择会话(最多连续三个完整的选择会话)。对于选择阶段,总共使用了15个线索组合;每个阶段在600次试验后或2.5小时后终止,以先来者为准。否则,动物将被放回训练课程中,直到重新达到标准的表现。汇总数据以每只大鼠连续三次完整选择会议的复合形式呈现。行为数据采用MATLAB中的glmfit函数进行探针回归拟合。偏好得分是通过计算可用奖励(黑加仑滴数量−柠檬滴数量的差异)来计算的,这些动物选择黑加仑预测或柠檬预测线索。长期偏好比较是4个月大学关闭前连续三次完整选择课程的偏好得分,以及4个月大学关闭后前三次完整选择课程的偏好得分。对连续三个阶段的偏好得分进行了短期偏好的比较。选择的潜伏期是通过计算从强制性的2秒提示呈现期结束到动物对每种试验类型的鼻尖反应的平均潜伏期来计算的。对于每只动物,我们从所有其他试验类型中减去具有最快平均反应时间的试验类型,以获得选择的相对潜伏期。
我们进行了控制行为来解释光抑制的非特异性效应。动物被放置在一个操作室内,安装在屏幕上;左边的入口配备了一个用于奖励的舔嘴。进入左门静脉1秒后,动物在门静脉中心看到一个单一的视觉提示。2秒后,动物必须在第二个门静脉进行鼻戳以表示反应。奖励将在左边的传送门中传递。奖励收集之后是一个5-10秒的变量ITI。动物需要超过12秒的时间来表示反应的试验,以及动物需要超过5秒的时间来获得奖励的试验,都被排除在外。
5.3 光遗传抑制
大鼠被放置在操作室和顶部分支,直径为200μm的光纤补线(Doric)耦合到473纳米(omicron)和635纳米(CNI),或594纳米(cobalt),激光设置到植入的光纤。然后,立即将贴片线的电源输出调整到8 mW(473 nm)、5 mW(635 nm)或10 mW(594 nm)。动物接受随机交错呈现的受抑制和不受抑制的试验。在SwiChR 抑制试验中,当视觉刺激时,给予1秒的473nm光刺激启动抑制;当动物离开中心门静脉时,给予1秒的635 nm光刺激缓解抑制以表明其选择。在盐紫质抑制试验中,当视觉刺激出现时,594nm光刺激开始,当动物离开中心门静脉以指示选择时终止。
5.4 慢性电生理学
动物在右侧DMS和右侧OFC上植入64通道硅探针。在植入当天,电极被降低到感兴趣部位上方的500 μm。让动物恢复2-3周后,再恢复行为训练。微驱动器在每次录音开始前2天被降低了250 μm。使用无线采集系统(白质LLC)在20 kHz条件下采集电生理数据。在自由活动的大鼠中进行记录,这可能会影响观察到的神经反应的偏侧化程度。使用开放的Ephys采集系统在30 kHz时获取行为时间戳。通过对每个开放的Ephys样本向白质LLC采集系统发送一个信号来同步时钟。
5.5 急性电生理学
在OFC中表达SwiChR 的动物被异氟醚麻醉,并放置在一个立体定向框架中。在OFC上放置开颅,将定制光极(200μm纤维粘在硅胶探针上)插入感染细胞区域。录音是使用一个开放的Ephys采集系统,对电压信号施加一个从300到6000Hz的带通滤波器。给予1秒的蓝光脉冲(473 nm,8 mW)启动抑制,4秒后给予1秒的红光脉冲(635 nm,5 mW)缓解抑制。激光定时由一个Master-8脉冲发生器(AMPI)控制。
5.6 电生理数据分析
峰值使用Kilosort2进行排序,并使用Phy2手动进行管理。为了分析目的,峰值间隔小于1%且小于2 毫秒的单位被认为是单个单位。峰值计数被装在50毫秒的箱子中,以25毫秒的增量进行分级,并在整个过程中转换为z分数的发射率。z得分的射击率与任务事件(线索呈现、选择鼻尖和奖励传递)一致,并在每次试验基础上减去500毫秒的平均发射率。任务调制单元是根据500ms基线和10个500毫秒周期内的Wilcoxon秩和检验确定的。如果在错误发现率校正后,任何一个任务时期与基线有显著差异,则认为一个细胞被认为是任务调节的,校正后的显著性阈值为P < 0.001。对于每个神经反应,我们对一组10个预定义变量中的每一个进行线性回归。在主观价值回归中,通过寻找动物选择黑醋栗和柠檬水的可用奖励的差异,计算每个阶段的偏好得分。然后将这个分数添加到每次试验中可用的柠檬水量中,以产生主观价值预测器。如果回归斜率与零有显著差异(P的正确显著性阈值为P < 0.001),则认为单位被变量调节。
解码分析采用四倍交叉验证的线性支持向量机进行。分类精度的计算方法是四次交叉验证分割的平均值,重复5次。对于单次试验分析,预测的选择参数计算为决策值在每个时间点决策值与支持向量的垂直距离,在四个交叉验证分割中重复。预测的选择参数的相互相关性在选择鼻尖周围的3秒内被计算出来,并在每个会话中平均进行20次解码重复。单次试验预测的选择参数采用50ms高斯滤波器和250ms高斯滤波器进行可视化进行平滑分析。对于延迟分析,我们设置了一个任意的阈值为0.33。在所有的解码分析中,整个大脑区域的单位数量都与记录的最小种群的大小相匹配。
5.7 组织学处理和分析
大鼠经心灌注150 ml PBS安乐死,再用100 ml 4%多聚甲醛安乐死。提取大脑,在振动机上切割100μm的切片。切片用GFP(1:1000,Abcam)一抗和Alexa Fluor 488(1:1000,Invitrogen)标记。在轴突示踪研究中,将显微注射针插入大脑(bregma坐标: 4前后,±2中外侧,−3背腹侧)和0.5 μl AAV8 hSyn:以0.1 μl min−1的速度注入OFC。至少8周后,对大脑进行组织学准备,并对轴突投射进行量化。简单地说,使用×20物镜在共聚焦显微镜上成像100μm的冠状切片,所得到的图像在ImageJ中进行处理以进行定量。简单地说,首先手动去除注射部位,并减去背景。阈值设置为×4,局部背景的平均值,超过该阈值的像素被解释为来自OFC轴突的正信号。根据4,6-二氨基-2-苯林多尔染色和Paxinos和Watson大鼠脑图谱手动定义感兴趣区域(ROI)边界。轴突密度计算为包含阈值以上像素的总ROI的百分比。分析每个ROI的三个切片,并取这些值的平均值,计算每只大鼠每个ROI的单个值。这种方法不能区分轴突末端和通道纤维。
5.8 全脑清洗
成年Long–Evans大鼠用异氟醚麻醉后置于立体定向框架内。将微注射针插入大脑(Bregma坐标: 4前后,±2中外侧,−3背腹侧),0.5 μl AAV8 hSyn:以0.1 μl min−1的速度注入OFC。8周后,大脑准备使用SHIELD进行成像。简单地说,大鼠经心脏灌注安乐死,100 ml 4%多聚甲醛,50 ml 12%环氧物SHIELD灌注液。提取大脑,在4°C的SHIELD灌注溶液中孵育48 h。将大脑从SHIELD灌注溶液中取出,转移到SHIELD OFF溶液中,4C孵育48 h。然后将大脑转移到SHIELD ON溶液中,在37°C下孵育24小时。SHIELD反应完成后,将大脑转移到SDS清除溶液中,以37°C被动清除7天,然后转移到SmartClear系统进行主动清除10-14天。当大脑清晰时,用0.1%的Tween 20在37°C下洗涤3天,然后在室温下用exPROTOS平衡2天,并使用COLM光片显微镜成像。
5.9 统计和可重复性
数据以平均±标准差表示另有说明者除外对原始数据进行正态分布检验;统计分析采用学生t检验、Wilcoxon符号秩检验或采用Bonferroni校正的方差分析进行多重比较。使用Prism(PraphPad软件)和MATLAB(MathWorks)进行统计分析。没有使用统计学方法来预先确定样本量,但样本量是基于以前的研究。由于实际原因,数据的收集和分析不能在无视实验条件的情况下进行(例如,因为纤维的位置明显不同),但数据是自动收集和分析的,以防止实验者的偏差。
参考文献:Orbitofrontal cortex control of striatum leads economic decision-making.