正弦波语音和“绿针”效应

我们接下来的例子涉及声音,鉴于我们大概是用眼睛而不是耳朵来阅读,这些内容可能不那么直观。你如果现在不在一个可以联网的设备附近,仅仅阅读下面的文字就足够了。但你如果能够打开一些音频文件,就会发现非常值得:你将有机会亲身体验这些非常简单但又极富戏剧性的效应。

首先要讨论的现象被称为“正弦波语音”。正弦波语音录音是一种人为降低质量的正常语音录音,用纯音哨声代替了声音流的关键部分。这项技术是在20世纪70年代初由美国哈斯金斯实验室发明的,作为研究语音感知的本质[21]的一种手段,具体而言,就是对各种关于声音流的哪些部分对听语音至关重要的理论进行检验。正弦波语音听起来像是一系列起初难以理解的、包含升调和降调的哔哔声和哨声。

网上有许多录音(登录我萨塞克斯大学同事克里斯·达尔文的网页,可以找到一些我最喜欢的,或者只需搜索“正弦波语音”),它们听起来是这样的。首先,你会听到一段“语音”录音,质量低到听上去毫无意义可言。然后,你会听到原始录音,其中有人会说一个简单的句子,比如“水壶煮沸得很快”。之后,带有哔哔声和哨声的正弦波语音会再次播放。第二次听的时候,你的听觉体验会发生巨大改变。现在,你清楚地听到了语音中的词以及它们之间的间隔。这就像之前展示的穆尼图一样,只不过这次是以声音的形式。

如果你使用不同的例子多次练习,你就会迅速变得很熟练,甚至不需要先听原始的句子。听母语中的日常用语也有相同的技巧——你的预测越准确(也许是因为你认识说话者或者有相同的口音),声音听上去就越清晰。在每种情况下,都有一个良好的预测模型可以改善感知。这样的模型使用预测来帮助你从噪声中辨别信号。之前听起来像一系列无意义的哔哔声和哨声,现在听起来像是一个结构化的句子,尽管声音有点儿失真。与原始体验相比,差异是如此之大——就像将原始声音文件用另一个截然不同的文件替换了一样。

再举一例(有些人可能对这个例子已经很熟悉了),重复播放声音,同时从两个不同的词(或词组)中任选一个呈现在屏幕上,比如“brainstorm”(头脑风暴)和“green needle”(绿针)。令人惊奇的是,你听到什么似乎取决于眼前的是哪一个词,可这两个词听上去差异非常明显!这是因为眼前的词会使基于证据的平衡偏向于其中一种听觉预测而非另一种。你所体验到的显著差异再次揭示出你的听觉体验在多大程度上是由你自己的预测构建的。在搜索引擎中输入“green needle”和“brainstorm”,你将有机会亲身体验一番。

这些效应看似神奇,但它们都属于正常的感知现象。我们能借助感知理解自己所处的世界,既离不开外界传入的感觉信号,又要仰仗丰富的、基于知识的隐形预测。