当一个任务增加了更多的步骤时,这个回路会帮助你注意到
生活充满了需要学习的过程,当这些过程变得更加复杂时,需要重新学习。一天你只用密码登录一个应用程序,然后第二天你也需要一个代码短信给你。有一天,你可以把你最喜欢的微波午餐放进烤箱里连续烤六分钟,但随后包装改变了,你必须煮三分钟,搅拌,然后再加热三分钟。我们的大脑需要一种方法来跟上。麻省理工学院皮考尔学习与记忆研究所的神经科学家们的一项新研究揭示了一些帮助哺乳动物大脑学习增加步骤的回路。
在自然通讯科学家们报告说,当他们改变一项任务的规则,要求老鼠从只执行一步调整到执行两步时,大脑表面或皮层上的一对区域就会合作,更新对这一理解,并改变老鼠的行为,以适应新的机制。的前扣带皮层(ACC)似乎能识别大鼠做得不够的时候,并更新运动皮层(M2)的细胞来调整任务行为。
“我大约在7、8年前开始了这个项目,当时我想研究决策,”东京大学的研究员Takeuchi Daigo说,他是Picower研究所理研-麻省理工学院神经电路遗传学实验室的博士后,由资深作者和Picower教授Susumu Tonegawa指导。“新的研究正在寻找M2的作用。我想研究是什么上游电路影响了这一点。”
搞砸了第二步
Takeuchi和Tonegawa追踪了通向M2的神经回路连接,发现许多神经回路起源于ACC。他们开始看到ACC在指导M2的连续决策中的作用基因操作在ACC细胞中,这使得它们能够抑制自身活动。ACC的这种“化学”失能有一个非常具体的影响。当任务规则改变时,老鼠不再需要把鼻子伸进一个洞里来获得一点奖励,而是必须把鼻子连续伸进两个洞里,具有沉默acc的啮齿类动物需要更长的时间来实现规则的改变。与ACC活动正常的大鼠相比,它们在意识到第二次戳的必要性时耽搁了更长的时间。然而,无论老鼠的前扣带区是否被静音,它们都能顺利地从两步后退到一步。
当科学家们用化学方法使M2中的ACC细胞末端沉默时,他们得到的结果与整个ACC沉默的结果相同。他们还使大脑皮层的其他区域沉默,但这样做并不影响大鼠注意和调整规则开关的能力。这些操作共同证实,正是ACC与M2的连接帮助大鼠注意到并适应从一步到两步的变化。
但是ACC在M2中有什么作用呢?Takeuchi和他的合著者在大鼠玩戳鼻子、改变规则的游戏时测量了M2细胞的电活动。他们发现,许多细胞被不同的任务规则(即一步或两步)特别激活。然而,当他们沉默ACC时,它抑制了这种规则选择性。
在M2中,Takeuchi和他的团队还注意到神经元群体对积极的结果(正确完成任务获得奖励)和负面结果(错误完成任务得不到奖励)。他们发现,当他们沉默ACC时,这实际上增加了消极结果编码神经元的活动负面的反馈特别是在规则从一步改为两步后的前10-20轮。这与大鼠最差表现的时间或“时代”密切相关。
他们在研究中写道:“动物第二选择表现的特定时代中断,似乎与ACC沉默导致的消极结果激活神经元的活性过度增强有关。”
研究小组进一步证实,通过使用不同的技术压制ACC,反馈或结果阶段很重要。通过设计ACC神经元被闪光抑制(一种被称为“光遗传学”的技术),他们可以精确控制ACC何时离线。他们发现,当规则从戳一次变成戳两次时,如果老鼠做出了错误的选择,他们就会导致老鼠继续犯错。在大鼠做出正确选择后,光基因沉默的ACC并不影响它们后续的行为。
他们写道:“这些结果表明,ACC神经元在第二次错误反应后处理错误反馈信息,并使用该信息调整动物在后续试验中的顺序选择反应。”
门槛太高
证据描绘了一幅清晰的画面:当老鼠需要注意到现在需要额外的步骤时,ACC的工作是从负反馈中学习,并向M2发出信号,让它采取第二步。如果提供反馈时ACC没有作用,那么强调负面结果的M2细胞显然会变得特别活跃,大鼠在最终理解之前会有一段时间未能完成所需的第二步。
为什么ACC活性降低会以某种方式增加M2中阴性结果编码细胞的活性?Takeuchi假设ACC实际上所做的是刺激M2中的抑制细胞,这些抑制细胞通常调节这些细胞的活性。随着ACC活性的降低,编码M2细胞的阴性结果抑制减弱。他的理论是,行为上的结果是,大鼠因此需要更多的证据来证明规则的改变。Takeuchi承认,这种机制还不完全清楚,但老鼠显然需要更多的时间来体验做出第二步正确决定的结果反馈,然后它们才会确信自己走在正确的轨道上。
Takeuchi说,虽然研究结果展示了适应过程中需要更多步骤的规则变化所需的电路,但它也提出了一些有趣的新问题。当一个多步骤的过程变成了一步的过程时,是否有另一种注意回路?如果是,该电路是否与本研究中讨论的电路集成?如果阈值模型是正确的,它究竟是如何工作的?
这不仅对理解自然顺序决策的神经基础很重要,也可能对从游戏或工业工作等AI应用很重要,每一个都可能涉及多个步骤的任务。