- 体验机器:我们的大脑如何预测和塑造现实
- (英)安迪·克拉克
- 2393字
- 2025-05-07 12:03:12
节俭的大脑
用预测来解释感知还有一个重要的好处:它揭示了大脑如何以一种非常高效的方式处理传入的感觉信息。众所周知,信息科学的主要目标之一就是提高通信效率,这门科学在开发非常节俭的信号传输方式方面发挥了重要作用。20世纪中叶,全球电信系统由于需求持续增长而不堪重负。对电信巨头来说,要使用老式电话线传递越来越多的信息,就要直面通道噪声干扰严重且传输能力有限的问题。这给了信息科学以用武之地:信息理论家最终为提高信号传输的经济性而开发了一项沿用至今的强大技术——线性预测编码。[12]
线性预测编码的起源可追溯至1948年香农发表的一篇论文,他是供职于贝尔实验室的数学家和密码学家。这篇重要的论文指出,英文文本可以利用单词和字母之间的可预测性,以一种非常高效的压缩方式进行编码。如果某个字母之后几乎总是跟着另一个字母,那么一个高效的编码方案就可以做这样的简单假设,除非遇见需要特别标记的例外情况。仅标记那些偶发的例外要高效得多——比编码每个字母更节约带宽。
有了恰当的预期,即便没有信号也能携带大量信息。假设你制订了一个计划,告诉别人,如果你不给他们打电话,那么一切都将“按计划进行”,也就是说,你会在当地时间下周三上午9点飞抵迈阿密,他们应该接机。直到那天,接机者都没接到电话,但这一事实(可转化为1比特的信号)恰恰传达了非常重要的信息:你将会乘坐飞机,在那个时间、那个地点抵达。其巧妙之处在于,接收者拥有的智慧与先见之明抵消了你本该为编码和传输所有信息而承担的成本。
各种基于预测的压缩技术已让电信技术的发展受益匪浅。[13]原则上,你可以利用关于特定信号最可能形态的先验知识来帮助预测接收端的信号,这样,珍贵的电线和电缆就可以只用来传输与预测模式不同的信号。接收端只要根据该残差对信号进行更新即可。这个过程的精妙之处在于,只需要传输少量的误差,就可以重构丰富的内容(比如图像或消息)。这些丰富的内容主要建立在预测的基础上,但能通过残差与现实锚定。
这种借助有依据的预测压缩信息的方法,其实就是通过“回补”(adding back in)所有能被成功预测的元素来有效地节约带宽。正因有了这门绝技,我们才能用JPEG和MP3等格式以经济的方式存储和传输图片、声音、视频文件。对图片文件而言,预测编码的原理是假设每个像素的值都可以根据相邻的各像素的值来实现较好的预测。在满足这种条件下(通常都满足),我们不需要传输该像素的值。所有需要编码的仅仅是预测值的偏差。但这只是一个简单的规律。只要存在任何形式的可检测的规律,预测(和借助预测的数据压缩)就可以实现。
我们再看看视频文件的运动压缩编码。1959年,视频文件的帧间预测编码技术问世。为了更好地理解,想象一下视频的内容是一个人在沿着走廊跑步。[14]视频的第4帧和第5帧的视觉背景没有任何区别,唯一的差异是跑步者前进了一点儿。有了现成的可预测内容(背景),我们只需要传输少量的差异(残差),就能完整地捕捉第5帧画面。换言之,你可以认为第5帧是对第4帧的微调,两帧画面的差异只在(比如说)脚的位置,因此将脚的位置信息通过系统传输的成本远远低于传输第5帧中每个像素的新值。这种技巧至今仍在使用。
现在请想象一个已经了解了更多信息的系统,比如,一个了解各种不同的奔跑步态的动态细节的系统。这样的系统能利用更详细(更“高层级”)的信息进行预测,因此只有意料之外的脚部动作才会引发预测误差信号。假设脚部动作和预期一致,那么就不需要更新帧间信息。这种更智能的系统甚至可以产生通常的持续运动幻觉,仅在有意外发生时更新(比如跑步者突然被绊了一跤)。无论预测有多复杂或高级,新异信息都要由预测误差来传递,在不符合预期之处发出信号,从而让我们与一个不断变化且时而令人惊讶的世界保持接触。
人类大脑似乎受益于这种智能的预测策略,并使用了“多层信息处理”这一强大的方式。[15]在这种多层级的情境中,简单的预测被嵌套在不那么简单、更抽象的预测之中,就像我们在奔跑步态的例子中所示,对步态的预期是一种更高层级的预测,反过来又会生成关于实际脚部位置的预测(更低层级的预测)。在那一刻,预测误差形成并通过系统向上传输。这些细微的差异进而对各层级的猜测进行微调,比如跑步者当前的步态与我们的预期不符,因此要调整我们的预测,使其与信号更加契合。
在大脑的预测处理架构中,我们通常认为有不同的神经元集群专门负责不同的功能,因此较高的层级就能利用自己的专业知识和专属资源来尝试预测较低层级的状态。具体而言,一个专注于预测完整单词的层级可能会利用自己的知识来帮助预测更低层级的状态,后者专门识别字母。而负责预测单词的层级本身可能会被专门从事完整语句预测的更高层级预测。本书附录中提供了一个与此相关的详细示例以及其他细节。
目前需要注意的是,在这种多层级的安排中,所有向前流动(从感受器边缘流向大脑深处)的都是新异信息——与预期的偏差。这样非常高效。一些信息如果已得到了很好的预测,就不应占用宝贵的带宽来向上传递。如果你每天按部就班地工作,公司总部又干吗要费心思过问你的进度?同样,在神经层面,每个层级的预测误差只会传递预料之外的内容,即可能需要进一步思考或采取行动的内容。
像这样的系统在利用输入信息时非常节俭。相较于尝试从头处理每一条信息,它们会高效地筛选和过滤输入数据,只突出显示那些预料之外的部分。说到底,人类对现实的体验是大脑产生的幻觉。这意味着我们所体验的世界在某种程度上是我们所预测的世界。感知绝不仅是一扇窥视世界的窗口,非要这样比喻,那就是镶在窗棂上的玻璃从一开始就带有我们自身的预测和期望的色彩:不仅意味着我们的观念和偏向会影响我们后续对事物的判断,预测还会在更深层、更原始的意义上塑造我们的感知过程——作为使我们与世界保持接触的特殊机制,感知活动始终在丰富的预测和期望的驱动下进行。
在接下来的章节中,我将尝试让你亲身体验预测的力量如何改变你的所见所闻。