首页科技快讯为什么说大脑是预测机器

为什么说大脑是预测机器

来源：晰数塔互联网快讯时间：2020年04月30日 11:30

本文来自微信公众号：神经现实（ID：neureality），编译：张紫雯、李蔚、山鸡，题图来自：电影《超体》

摘要：预测塑造了我们感知、理解这个世界的方式——这一观点在系统神经科学界变得越来越有影响力，同时也为我们理解神经精神性失调提供了一个框架——一般情况下，先验信息会影响我们的感知和观念；而这一机制在精神失调人群中被干扰了。这导致了患者无法形成表征这个世界的最优模型。

越来越多的人将预测的影响概念化为“自上而下”的过程——从信息加工的角度来看，产生于（皮层）更高级区域的预测影响了位于更底层的区域。然而，这种看法并没有考虑“自下而上”信息加工过程中产生的预测信息。正如本文将揭示的一样，区分“自下而上”与“自上而下”的预测过程，是极其重要的。这种区分也是构建出预测加工框架的关键，这将帮助我们理解预测加工过程中的失调是如何引发精神性失调的症状与体验的。

生命使用感官输入来发现周围的结构，从而创造出对环境的表征。这样的表征是施动者（agent）*调控与外界交互的关键。然而，感官输入含义模糊并且充满噪音。因此，大家认为对环境的准确表征，也是需要先验信息的。先验信息提供的预测也许能消除感官信号的模糊，并且让人可以推测导致感官输入的外部刺激。根据这个预测加工的框架，基于关于外部世界的先验信息作出预测，是大脑的关键功能。

就如人们在强化学习和人工智能的领域中所做的，在控制论的领域，我们也将系统——即一套互动组件构成的统一整体——细分成许多施动者及其环境。我们应该如何分辨系统、施动者和环境，取决于具体的问题。比如，系统可能是一条鱼（施动者）根据旋涡和水流（环境）做出反应。此外，系统也可以是鱼骨骼器官的部分（施动者），在整个身体（环境）中活动。又或者，我们可以将水流和其中的所有生物视为系统。

控制论学家考虑的是，施动者在面对环境的变化时，如何与环境交互从而维持内在的稳态。早期的控制论学家意识到，这个假设同样也可以用来架构大脑的研究——施动者对环境扰动的最佳反应是预先行动（proactive）而非随机应变（reactive）；也就是说，预测是必要的。这个领域的先驱之一，威廉-罗斯-艾什比（W. R. Ashby），和他的同事提出了两个定理，来说明施动者如何能够成功抵抗环境扰动：

既然环境多变，施动者也要多变。在控制论的领域中，多变性（variety）是指一个系统（环境或者施动者）能处在的状态的总数。如果一个施动者为了维持自己内在的稳态，去控制或调节环境对他们的影响，那么施动者能处的状态总数一定大于环境影响他们的方式总数。这就是所谓的必要多变性定理（Law of Requisite Variety）。值得注意的是，这个定理是指施动者通过应对环境的影响，在理想范围内维持内在稳态的能力。因此，施动者必备状态的数目一定会等于或大于所在环境可能扰动或者影响其的方式总数，而非环境能够达到的状态总数。

威廉·格雷·沃特（William Grey Walter）和他著名的自动化“陆龟”机器人，该系列机器人可以对外界的光线产生反应、碰到障碍物调整方向、循着导航灯光回到充电处充电，还能彼此产生一定的互动，甚至对镜中的自己产生反应。—cmu.edu

一个好的调节者能为其所在的环境建立优秀的模型。与必要多变性定理密切相关的是优秀调节者定理。这是一个数学概念：如果施动者成功地减轻了环境状态的影响，从一些意义上来说，施动者一定建立了一个环境的模型。这就是说，施动者一定知道要用什么样的内在状态来应对什么样的环境状态。

早期的控制论学家主要关心的是简单施动者的性能。其中有一个著名的例子就是一系列的自动化“陆龟”机器人。这些机器人能够简单地对环境中的变化作出即时反应，以此参与到与环境的复杂交互中。控制论学家很快意识到，同样的定律也适用于大脑中的信息处理：为了成功对环境变化作出正确反应，施动者需要对环境的相关方面进行建模和预测。这意味着，想要了解大脑的设计，我们可以仔细观察大脑面对的这个外界环境。

- Stephan Schmitz -

这一观点在心理物理学、灵长类电生理学、认知计算神经科学和临床神经科学领域变得越来越有影响力。在这些领域中，这个观点为感知、观念和行为的紊乱提供了全新的视角。然而，这些领域对“预测”本身的定义常常不明确，因此对这个术语的使用的也很不精准。几乎在每个地方，预测都被认为是在信息加工的等级中，高等级加工以“自上而下”的方式作用于低等级加工。本文中，我们将提供证据挑战这个仅仅考虑了“自上而下”的观点，并且表明神经系统中还包含了很多其他形式的预测信息，以“自下而上”的加工方式呈现出来。

在这篇观点文章中，我们认为，区分世界上两种规律（regularity）或者“模式”（pattern）是非常重要的，这两种规律共同构成了神经系统预测的基础。我们将介绍时空全局（或者恒常）不区分等级的规律（spatio-temporally global or constant, non-hierarchical regularities）与时空局部的规律（spatio-temporarlly local regularities）之间根本的区别，后者依赖于情景，因此是分等级的。

我们将提供证据表明，基于这种两种规律的先验信息的预测在机制上是不同的：它们与两种不同形式的信息加工（自下而上和自上而下）相关。最后，我们举例说明区分这两种形式的预测的重要性。虽然我们认为，随着相关领域研究的成熟，这两种形式的预测会被进一步细化，我们将这主要的区分——基于形式而非预测的内容的区分——视作是在健康和疾病领域，向更为综合和多样的预测加工机制，迈进的重要第一步。

预测的本质

预测是信息理论（information theory）和贝叶斯决策理论（Bayesian decision theory）中的重要部分。贝叶斯模型在帮助我们理解大脑功能上一度发挥了重要的作用，感知和认知推断（perceptual and cognitive inference）不仅仅依赖于当前的输入，而且也被所谓的先验经验或者关于环境结构的背景信息塑造着。

值得强调的是，贝叶斯决策理论提供了一个规范的框架：它允许研究者具体说明施动者考虑到能获得的信息时，应该如何利用当下的输入和先验信息来最大化特定的效用（utility），但是关于这一过程如何实施的准确机制仍然是不可知的。如同一个地图能详述最佳路线却不能提供最好的交通方式一样，贝叶斯决策框架是关于总体上的客观预测，而非预测是如何在神经系统中形成的。

预测编码（predictive coding）的概念很大程度上塑造我们了如何考虑神经信息的加工，并且在正常和疾病群体中，这个概念启发了一些最为详细的神经科学的预测机制。人们提出了一系列的预测编码模型。这些模型在计算上都是相似的，但是在神经元层面操作的假设却非常不同。然而，这些最有预测性的编码模型使得预测被进一步概念化为自上而下的加工过程。

在预示了如今预测加工框架大部分思考的控制论（cybernetics）领域中，早期研究对预测的本质提供了一个更广阔的理解。值得注意的是，我们这里使用的“预测加工”是作为一个笼统的术语，包含了预测编码；后者是预测加工的一种特定形式。

控制论这个术语来自于“舵手”（steerman）这个希腊词，这个词表示了一个成功的施动者一定会通过某种方式控制其周围环境的效应：这种控制不一定是通过限制环境，也可以是通过适应性地对环境相关参数的变化作出反应。舵手不一定要控制风，浪潮和洋流，但是舵手可以通过做出调整从而最小化环境对船只航线的影响。

艾什比提出了必备多变性定理（Law of Requisite Variety）和优秀调节者定理（Good Regulator Theorem），这两个互补的定理与我们的构想密切相关。这些定理提供了一个关于预测本质的视角。这两个定理意味着，考虑相关环境影响的结构，能够为我们关于施动者的根本的特征设计提供重要的原则性见解。随着这个想法的深入，环境能对施动者产生影响，施动者也能对环境进行建模。我们认为将环境的规则考虑在内，能够帮助我们理清必要预测的形式。

我们可以根据不同种类的环境规则对施动者产生影响的时空尺寸进行分类。一般认为，一些规则是时空全局（即不局限于特定的空间或者时间节点）的，并且与施动者与环境的每次相遇有关。这些规则独立于情境因素，因此是非等级的：规则的存在是不可改变的，且与当下情境或者环境中的其他状态无关。因此我们可以假设，对这些规则进行建模要求施动者经历并处理相似的情境。支持这个假设的证据正在不断增加，这些证据会在下文提到。

从这些证据出发，我们推断，让人得以进行时空全局规则预测的先验知识，是自下而上的加工结构的基础。这些先验信息对我们产生的影响是预测性的；从某种意义上说，这种影响是对施动者周围环境（与当下具体情境无关）的总体预测，并不依赖于当下的感官输入。我们假设，这种预测在每次施动者遇到刺激时无可避变地自动发生，决定和塑造了我们一直以来与世界的交互。

- Stephan Schmitz -

全局预测限制的概念虽然并非全新的，但是被现有的预测加工解释所忽略。现有的解释更多地的关注是另一种与时空局部规则相关的预测。这些规则只会在特定的环境下出现从而影响施动者。由于他们的情境依存性，这些规则具有等级结构，在等级结构中，情境状态决定了规则出现或者相关与否。

为了对这些规则进行建模，施动者的大脑必须反映出规则的特征。这可以通过一个有等级的、自上而下的加工系统来实现：高等级的信息加工机制提取当下的情境信息，然后将预测结果返回给低等级的单元，以此来调制先前的加工。

两种规则到预测的对应都有等价的控制论中的舵手比喻：船的材料和形状是不变的——因为舵手依赖航行的媒介的核心特质是不变的。对比之下，对船结构特征的利用一定进行了情境相关地变化，来应对环境特征变化（风，浪潮，和洋流）所带来的挑战。简单来说，施动者具有不变的特征，用来调控周围环境的恒定的影响，同时也有情境依赖的特征，这些特征反映和调控周围世界的情境依赖特征。在下一节中，我们将给出支持这个观点证据的梗概。

现在开始，我们将使用术语“限制”（constraint）来指情境独立的规则和由此形成的情境独立的预测的基础。这个术语来自于计算机视觉领域。在这个领域中，限制指代一个相似的观点。它直观地指出，神经系统的结构强迫信息加工沿着预先决定好的道路前进。这些道路的轨迹是施动者根据先验信息对环境的估计，因此是预测性的。

值得注意的是，我们不支持对“预测”这个术语的概念进行扩张。相反，我们认为，对于这个术语的计算概念的一致性使用，能引导我们思考自下而上加工的限制如何就是预测性的。与限制相反的是，我们使用术语，“期望”（expectation）来指代与情境依赖的规则的相关先验信息。注意的自上而下加工的影响在功能上与预测加工不同，预测加工是本文的所关注的，因此我们不会讨论注意的自上而下加工的细节。

规律与预测

情境独立规律性与约束

自然世界或许看起来千变万化，然而，从高地草甸到地中海海岸，自然景观在图像中表现出了千丝万缕的联系：不同图像在诸如局部线条方向、轮廓的形状与物体的摆放位置的分布上都非常相似。感官系统在解读图像时利用这些规律来优化编码信息，从而在耗能最小化的同时实现最优表现。如今，越来越多的研究着眼于从神经学角度，探究感官信息（sensory evidence）与基于先验知识的预测（knowledge-based predictions）是如何整合的。

这些研究结果表明，人们基于先验信息总结出的全局性、情境独立性规律被内隐地镶嵌进了信息加工机制的结构中。举个例子，在景观图片中的方向信息并不是均匀分布的——垂直与水平方向方向在图片中往往存在着过度表达（over-represented）。正如感官系统对主轴（cardinal axes）方向存在着感官偏差，以及神经元对于该方向的敏感程度更高一样，人们在感知局部朝向（local orientation）时也存在着基于分布规则的倾向性。

重要的是，基于一些电生理学及功能磁共振成像研究结果，人们认为这种倾向/限制（constraint）是内隐地存在于初级视觉皮层（V1）结构中的调频于（tuned to）主要（cardinal）方向的神经元在V1区域存在着过度表达，且调频功能相较于其他神经元更狭窄。在该结构基础上，人们能够内隐地进行基于方向知识（先验信息）的贝叶斯推断（Bayesian inference），而无需将先验信息以自上而下层级结构（top-down hierarchy）的方式进行外显的表达。

一项关于另外一个环境基本属性规律——物体移动速度的研究显示，（先验）限制同样在神经元密度不均匀分布、相关神经元群调频功能较为狭窄的结构上得到了内隐表征。

人们还通过整体的、情境独立规律对于环境中局部表征进行分组。定义物体视觉边界的轮廓中同样存在着规律性。在提取图片中的轮廓信息时，人们的视觉系统会利用先验信息中的典型轮廓形状来对单个的位置信息进行分组使之成为更大的处理单元。这种分组机制称作“联想场（associate field）”，联想场中的方向信息分组与自然界中的轮廓分布规律极为相关。轮廓信息对于定义图片中的特征与物体信息至关重要。

动物研究显示，对早期视网膜皮层（early retinotopic cortices）神经元间平行连接（horizontal connection）的结构[MOU3]在联想场的建立中扮演了不可或缺的重要角色。近来，一项动物研究探究了方向调频（orientation tuned）的V1神经元中的 “寂静（silent）”背景。寂静背景指的是当刺激位于特定视觉区域时，该刺激本身虽不足以激活激活神经元，但能够调节该神经元的活动。该研究表明V1神经元的水平连接结构在其空间排布上与人类的心理物理联结场（psychophysical association field）极其相似。

V1区域平行联接排列结构的发现为人们利用与环境结构相关的先验信息对轮廓识别进行预测提供了神经生理学证据。这些结构嵌入式的限制保证了轮廓中的局部方向信息与我们对世界结构的先验知识相一致。关于轮廓整合的情境独立机制可能会受到自上而下层级结构的影响。

甚至在完整的物体中也存在着情境独立的基本规律。一个例子是，物体的轮廓通常随着物体一同弯曲（convex）。尽管包含自上而下过程在内的一系列机制都参与了视觉系统将物体从背景中分离的任务，仍有研究表明，情境独立预测以将弯曲度（convexity）限制镶嵌于自下而上处理程序内的方式在该任务中发挥重要作用。

在V1区域中，前馈神经联结与反馈神经联结终止于不同的层级（layer）中，这为我们对自上而下调节与包含了平行影响（horizontal influences）在内的自下而上调节的分离提供了机会。一项对恒河猴使用层级录制（laminar recordings）的研究表明，V1中的平行联结在早期图像-背景分离中发挥了重要作用。

重要的是，计算模型显示，V1区域内神经环路间的促进与抑制平行连接的专一性保证了预测的实施，且这种预测中的弯曲度限制来自于物体结构的情境独立性规律。

- Stephan Schmitz -

另一个证明背景独立性规律的例子源于这样一个事实：部分物体类别常出现在符合经验规律的位置上。由于我们的生理感官是用于识别环境的，真实世界中物体的坐标规律性因此被转换成为视网膜成像上的规律。举个例子，草坪与地毯的坐标位置可以转换为我们的下半部分视野，而面孔与文字可转换为我们上半部分的视野。

近来一项关于神经元群感受野（populational receptive fields）的研究显示，对位置规律的预测产生于与特定物体类别相关感受野的高级视觉皮层神经元中，也就是说，感受野对特定物体类别在视野中常出现的位置出现了偏向性。譬如，在英文母语者中，与文字识别相关的神经元群在感受野中的表现为范围更小、偏向视觉正中，且更偏向于水平排布（而非垂直排布）。该发现在人脸与景色识别中同样得到了验证。

总而言之，上述研究表明了外界环境的规律性信息被内隐地编码于信息处理系统中，且为该系统中稳定的结构性成分。预测由此影响/限制了自下而上的信息处理过程。本段落中我们主要着眼于知觉过程，但还有更多来自学习或其他认知领域的研究同样为情境独立限制提供了证据。譬如，一些实验证明了不同生物体（organism）对于环境规则的习得程度是不同的。不同生物体对于学习的准备状态似乎受到了不同程度的限制，限制强度可能是由环境规则与该动物的相关程度决定的。

近来一项关于果蝇的准备学习（prepared learning）研究为该发现提供了证据。该研究团队对两组果蝇施加不同的实验处理：一组在施与视觉信号后施加厌恶性刺激，另一组在施与嗅觉信号后施加厌恶性刺激。在经过40代繁殖后，两组果蝇对不同的刺激（视/嗅）产生了不同的准备状态。将预测建立在对自下而上信息处理过程的限制中，能够使得某种特定动物最大程度地利用环境信息，在保证发挥状态的同时降低代谢耗能。因此，我们不难理解为何人们在开发人工智能算法时会将情境独立规则镶嵌进人工智能网络中。

而这种镶嵌于结构中的限制源于何处呢？无论是从理论抑或是方法论上，我们都很难将系统发育（phylogeny）与个体发育（ontogeny）对动物的影响分割开来。本文将不对该问题进行进一步的讨论，但现存的证据表明，不存在一个能够解释所有相关现象的理论。系统发育与个体发育可能交互影响了神经系统中该限制的产生。在一些极端例子中，人们发现该限制可能以独立于感知经验的方式而与基因编码相关。在另外一些例子中，该限制还可能与成年后的相关经历有关。

情境相关规律与期望

另外一些环境规则以情境相关（context-dependent）的形式出现。设想这样一个场景：在森林漫步时，我们更可能观察到林地鸟类而非涉禽类。对鸟类种类的识别因而激活了人脑中用于预测特定特征的表征——比如对某种形态的喙的表征。喙的出现预示了某些基础水平（lower-level）的规律，例如某些特定轮廓及某些朝向边缘出现的视野位置。

在这个例子中，对情境的依赖性取决于输入刺激的低水平局部特征规律是由其更高水平特征决定，还是由与该刺激无关的信息决定。因此，除了情境独立性特征外，环境结构中还存在着一种等级嵌套特征：环境中的高等级规律性决定了低等级规律性。我们预测，大脑中必然存在着类似的，用于处理情境相关环境规律的等级嵌套式信息处理机制。我们认为该处理机制中存在着一种自上而下的结构，高级程序由此能够提取情境信息（contextual information），进行推理预测，并将该预测回馈至模型中，进而影响早期知觉过程。

在大脑皮层结构中存在许多能够支撑自上而下处理的证据。在上文所举的鸟类学例子中，环境情境信息决定了我们更有可能碰见哪种鸟类。研究表明，大脑能够借助情景-物体相关性（scene-object dependency）对物体进行感知。例如，人们对置于常规情境中的物体识别速度更快。人们认为高水平情境加工皮层（high-level context-specific cortices）由情景作出的预测反馈至低级物体表征中，从而产生了这种促进作用[73]。

当物体粗略的边缘从背景中提取分离出来时，人脑便推导出规律性预测，由此产生了局部特征处理与预测间的动态交互影响。许多关于灵长类动物的电生理学研究显示，自上而下结构能够极大程度地对信息加工各层级进行过滤，这种过滤甚至影响到了位于皮质下结构的早期信息加工阶段。

在上文例子中，预测信息主要来自于感官输入。然而近来，越来越多的研究指出自上而下结构不仅仅利用了感官输入信息。例如，鸟类学专家能够迅速地发掘并辨认鸟的种类。心理物理及脑功能成像研究给出了这样的证据，即对某种物体的专业知识（knowledge）能以自上而下的形式对物体识别发挥显著的促进作用。此外，心理物理学研究显示，对特定物体成分甚至语义意义的预期也能以自上而下的形式影响早期视觉特征的识别。预期产生于感官输入之前，存储于高级记忆系统中。脑功能成像研究也给出了类似的证据——储存于顶叶/额叶区等分布式网络中的物体先验知识，动态影响了早期视网膜皮层中的视觉成像。有趣的是，心理物理学及脑功能成像研究均发现了只有对刺激成分的期望能够激活早期视觉皮层中的特征模版。

- Stephan Schmitz -

人类及社会性动物的社会互动（social interaction）有较强的情境相关性。一些研究显示基于先验社交知识产生的预期对信息加工产生了极其重要的影响。心理物理学研究显示，人们能够利用社会互动知识中的情境相关规律来理解他人动作模式中的信息。这种指导关系同样是自上而下的。甚至是对他人心理状态的预期，如他人产生某一动作的意图，都可能影响对社会性信息的早期知觉加工。

持续性暴露于相同或类似感官刺激下可能影响人们的感知觉加工，这种现象通常被称作适应（adaption）。适应现象纷繁复杂，人们对其背后机制的理解尚不完全。现存模型大多反对将其视作被动的“神经疲劳”（neural fatigue）而更倾向于将其理解为一种主动加工，但我们仍不清楚适应现象是否受到了预测加工的影响。人们认为，诸如对重复出现或可预见刺激降低神经反应强度、对不可预知刺激增加反映强度等现象与自上而下处理的情境独立预测相关。但另一部分研究显示自下而上加工也同样影响着适应现象。认为适应现象与自下而上加工相关的研究通常采用相似的实验处理，而认为适应现象与自上而下加工相关的实验采用了各种不同的实验处理。这些发现可能揭示了两种机制：一种是受情境独立限制影响的自下而上加工，另一种是受情境相关预测影响的自上而下加工。后者能够在多变的环境下发挥作用。

总而言之，许多研究指出，环境预测性可能是情境相关的。在这种情景中，我们在上一部分所讨论的镶嵌了预测信息的自下而上加工便显得不那么有帮助。产生最佳表现的个体通常能够利用预测来以自上而下形式灵活调整信息加工，而现今大多数预测加工模型研究也通常着眼于这种预测形式。

意义与应用

有的人认为，没有必要区分预测的不同形式，因为它们最终都服务于同一个目的：即促进对世界状态的推断，从而优化有机体与世界的相互作用。这种想法是有道理的，当我们努力去对行为进行高层次的、功能性的描述时，就像许多与最优化有关的模型一样。这些模型为从功能角度评估一个施动者的性能提供了宝贵的基准。

然而，预测处理框架经常做出一个额外的前提假设：即预测过程是由自上而下的机制介导的。正如我们上文所说的，这个观点是不完整的：预测信息可以在大脑中以至少两种形式实现。如果我们的目标是寻求在神经机制上的理解，那么修正当前的单一观点是有必要的。在许多方面，我们都已经看到了增强和扩展单一的预测处理机制的价值。

将计算模型与神经机制联系起来

如果一个计算模型只描摹出自上而下的预测模型，那么很可能面临着计算模型与神经机制之前脱节的风险，这将反过来阻碍模型和实证研究之间的反馈循环，以至于阻碍接下来的研究进展。检验包含错觉的预测过程阐明了这个问题。“错觉”是被故意制造出来的，它违背感官系统在正常状态中的运行。在目前的预测加工过程中，错觉被概念化为自上而下加工的结果。例如，经典的康士维效应（Cornsweet effect）——两个灯光斑被一个中心的渐变部分分隔开，造成在亮度上不同的错觉——已经被视为是自上而下影响的例子，这与关于亮度和反射的空间梯度的信念有关，并且已经使用了一个自上而下预测的网络进行了模拟。

然而，尽管它可能受到神经高层次水平的调节，大部分的影响是源于早期皮层下甚至视网膜的预测信息：康士维效应在理论上与视网膜神经节细胞的感受野结构有关，以及与外侧膝状体核（lateral geniculate nucleus）中信号有很强的相关性（视网膜神经节细胞的投射），并已被证明起源于单眼神经元，表明它起源于皮层之下。更简洁地说，用自上而下的框架来解释错觉的一个主要挑战是：导致错觉产生的神经回路可以独立于任何先前经验。这一点已经由临床证据表明：先天或者早发性失明的人在视力恢复手术后立即会产生某些错觉，比如缪勒莱耶错觉（Müller-Lyer illusion）。

康士维效应（Cornsweet effect）—blog.prototypr.io

这些错觉也许产生于预测处理的过程之中。然而，我们认为这些现象中的大部分（但不一定是全部）都可以被自下而上过程中，与情景无关的约束来更好地解释。比如，大量的错觉与来自上面的光有关。关于这个，我们将在下一节详细讨论。

在这个例子中，经验证据和计算模型之间的脱节表明，一个解释可能在计算层面上具有描述有效性，但是在神经机制层面上是不具备有效性的。有趣的是，已有研究表明，即使是饶（Rao）和巴拉德（Ballard）开创性的预测编码框架，也是可以通过这样一种方式加以重新描述：预测也许是通过横向抑制（lateral inhibition），而非反馈连接（feedback connections）来实现的。

显然，我们需要更紧密地集成神经机制与计算模型，并且在不同尺度上区分不同形式预测的不同。例如，最近的一项研究暂时支持这样一种观点，即情景相关的预测可能共享一个公共源（common source），而情景无关的预测可能依赖于共享另一个源的内置约束。

说明预测之间的相互作用

在分级预测处理过程中，预测是在信息处理层次的几个不同层次生成的。不同层次的预测被认为是通过自上而下的机制相互作用，以确保最终所有的预测都是相互一致的。然而，自下而上的约束和自上而下的期望可能以一种完全不同的方式相互作用。由于约束在很大程度上不会因为预期的短期变化而变化，约束和预期可能会影响相同的过程，但不会相互直接影响而相互对齐。

“自上而下的光的先验”提供了一个很好的例子。光线照射到视觉场景的方向和由此产生的阴影，提供了人类视觉系统用来推断物体形状的信息。在缺乏光源位置的明确信息的情况下，人类观察者判断物体的性状表明，视觉系统会保守地预测光线来自上方。

有趣的是，这种预测可以通过经验来修正；经过训练后，观察者收到的反馈表明光源的位置已经改变，视觉系统的预测就会移动到新的位置。对这一现象的传统预测处理方法表明，自上向下的预测信息已被更新。

然而，这与新先验与实验室环境的研究结果不一致——先验是由其他习得线索引起的。另一种解释与这种情景特异性和电生理学证据相一致，即来自上述光的先验是作为自下而上处理的一种约束实现的，并且不受短期经验的影响。实验训练并没有改变原来的约束条件，而是产生了一种新颖的、与环境相关的预期，即光线已经发生了变化。

- Stephan Schmitz -

我们关于不同形式的预测之间相互作用进行了一个有趣的假设：当来自约束和期望的信息相互作用时，前者可能永远不会被后者完全覆盖。这与纯粹自上而下的预测处理形成了对比，后者的最终目标是确保所有预测都是相互一致的。

此外我们的解释表明，自上而下处理的实验操作应该对新获得的预测产生不同的影响，但可能会保持原来的先验不变。这种差异效应应该进一步在神经水平上观察到。例如，我们可以预测，神经成像实验将显示在高级处理区域对光源位置偏移的短期学习的效果，而自下而上过程的神经特征将保持不变。

两种不同形式的预测之间的这种交互形式有助于在耐用性和灵活性之间取得最佳平衡，有趣的是，这种相互作用似乎并不是所有生物体都普遍存在的：即使经过长时间的经验积累，鸡感知物体形状的方式也表明它们的视觉系统假定光线来自上方。从出生开始，鸡似乎就有一种不可改变的自下而上的约束来预测来自上方的光线，并且无法获得一种与环境相关的期望来调节这些内置的预测，这有力地证明了预测信息可以完全与个人对世界的体验解耦。

确定机制，以告知临床相关的问题

在精神疾病的临床实践中，异质症状群体经常被误诊为同一个类别的症状，这是因为不同的诊断可能被重叠的神经生理学干扰。因此，研究往往避开标准的诊断类别，专注于单一症状，寻求更狭窄但是更深入的机制。预测处理框架一直是这项事业中的重要部分，但是它对单一预测形式的关注经常限制了该框架对症状多样性的解释。

以自体抗体介导的神经疾病和精神分裂症为例。越来越多的注意力被吸引到有精神疾病经历的人身上，他们的血清或脑脊液中发现了含有针对NMDA受体的IgA抗体。这些抗体可能是，但不一定是精神疾病的潜在病因。

由于抗体介导的精神疾病的免疫疗法只在临床需要时才进行，因此临床医生面临着一个需要神经机制层面的深入解释，而不是计算层面的解释。换句话讲，从临床的角度考虑，预测处理模型更需要一个神经机制层面的解释。

将施动者的神经工具箱与环境统计数据联系起来

我们已经提出，支持预测的环境中的特征被有效地归类为情景无关或情景相关的规律性，并且这些特征分别映射到约束和期望上。承认这些根本上不同的预测形式，可能会激发对预测的更广泛的处理框架。特别是，将施动者的信息处理与环境统计联系起来的目标，一直是自然场景统计工作中的一个指导原则，并为预测处理的研究提供了一个类似的原则性框架。

例如，对环境规律的分析可能使我们能够预测并解释这在多大程度上是由自上而下的过程或由自下而上的处理过程的约束调节，或者为什么预测过程对情景相关的短期变化的敏感性存在差异。更一般地说，对有机体环境中相关规律的分析可能有助于开发一个统一的框架，从而能够解释为什么有机体在不同领域的预测可能以不同的形式出现。这一观点提供了一种将预测处理框架与感官生态学和进化理论联系起来的方法。

结论

我们的论点背后的原理很简单：通过观察环境的结构，可以了解施动者的信息处理机制的关键设计特征。这一基本观点并不新鲜，它不仅推动了早期认知生物学家的思考，还促进了控制论专家，以及目前在自然场景统计方面的工作。

在此，我们认为，将这一原理应用于预测在大脑功能中的作用，将为我们提供一个全新而有用的视角。为达到对大脑作为“预测机器”的更深层次的理解，我们认为有必要认识到神经系统的预测有不同的形式。环境中不可变的规则性反映在相应的独立于情景的预测机制中，这些机制作用于自下而上的处理，我们将这些机制称为约束。

同样地，外部世界上下波动的、依赖于情景的规则性指向由自上向下过程实现的灵活的、依赖于情景的预测机制，我们称之为期望。随着预测处理的发展，期望能够被应用到越来越具体的、基于神经机制的问题上。

其他的区别可能会有用，但我们认为这里提出的概念是主要的和基本的。虽然我们主要从神经信息处理的角度来探讨这些思想，但对预测在信息处理中的作用有一个全面的认识必须最终包括对整个有机体与其环境相互作用的认识。

预测信息不仅存在于神经机制中，而且存在于整个生物体的形态中，这一点在许多感官生态学和行为生态学的例子中得到了证明。最后，预测处理框架的目标应该是将预测作为生物信息处理的一部分的许多不同方式结合起来，以便对我们如何与我们的健康和疾病世界相互作用提供更全面的见解。

编译来源：Teufel, C., Fletcher, P.C. Forms of prediction in the nervous system. Nat Rev Neurosci 21, 231–242 (2020). https://doi.org/10.1038/s41583-020-0275-5

本文来自微信公众号：神经现实（ID：neureality），编译：张紫雯、李蔚、山鸡，题图来自：电影《超体》

网址: 为什么说大脑是预测机器 http://www.xishuta.com/newsview22330.html

所属分类：人工智能