如何把信息组织成视知觉
前面各节讲的主要是视觉系统怎样抽提外界景象中的各种特征,虽然也讲到了视觉系统中有些神经元能够对整个特定的对象起反应,但是都没有涉及脑如何把不同的特征整合成整个特定对象,也没有谈到视觉系统怎样把外界场景中的不同对象的各种特性分别整合成不同的对象。后面的这些问题在科学上被称为“绑定问题”。为了把这一问题提得更清楚一些,我们在此引用坎德尔有关这个问题的一段论述:
有关颜色、运动、深度和形状的信息是由不同的神经通路来携带的,那么(脑)是怎样把这些信息组织成统一协调的知觉呢?当我们看到一个紫色的方箱子时,我们把有关颜色(紫色)、形状(方形)和深度(箱子)的性质结合成了一个知觉。我们也可以同样把紫色和圆箱子、帽子或外套结合在一起。
视觉图像通常是通过来自处理运动、深度、形状和颜色这样的不同特征的平行通路的输入建立起来的。为了表达在任何时刻视野中这些性质的特定组合,必须把独立的细胞集群临时关联在一起。这样,就一定要有一种机制,得以使不同皮层区中不同细胞集群独立处理的信息关联起来。这种机制被称为绑定机制,尽管至今还没有被研究清楚。(Kandel et al.,2000)
下面我们就来说说对这一问题的探索,尽管人们对这一问题仍没有作出最终的回答。
格式塔学派的观点
20世纪初,德国有一批科学家,包括韦特海默(Max Wertheimer)、科夫卡(Kurt Koffka)和科勒(Wolfgang Köhler)就开始研究绑定问题了,实际上就是研究我们是如何把所看到的东西在知觉上组织起来的,他们的一个基本思想是“整体不等于组成它的各个部分之和”。正方形并不等于同样长短的两条横线和两条竖线便是一个经典例子。人们对每一条线本身的感觉完全不同于对由它们所组成的正方形的整体知觉。他们创立了格式塔学派,格式塔是德文Gestalt的音译,意为组织结构或整体。该学派反对把整体还原到其组成部分来进行分析,因为他们认为整体体验中有某些知觉特性不可能通过研究其各个组成部分而得到解释。
人们常把韦特海默当作格式塔学派的奠基人,因为他是第一个为该学派的主要思想提供实验证据的人。1910年夏季,韦特海默前往法兰克福度假,在火车上,他突然想到一个实验方法,于是就在中途下了车,买了一台玩具频闪仪[一种以一定时间间隔(可调整)呈现一连串图像的装置]后,一头扎进旅馆房间就做起了实验。后来他又在法兰克福心理学研究所继续这一工作。其实,这个实验很简单:韦特海默在幕布上投放一横一竖两条亮线,如果这两条线同时显示,它们就构成了一个直角。如果在显示第一条线之后,过一会儿再显示第二条线,就看到上一条线似乎转动到了第二条线的位置,这是一种“表观运动”(或称“似动”),当两条线出现的时间间隔在60毫秒时,这种知觉最为明显。如果时间间隔太长或太短,就不会有这种运动感,要么看到两条线相继出现,要么就是同时看到两条线。韦特海默把这种表观运动称为“φ运动”。其实φ运动本身并不是什么新鲜事,但是韦特海默给予了它新的诠释。他认为他所体验到的运动不可能还原到其中单独的哪条线中去,对于为什么会产生运动感,他认为根本就不用解释,这种现象就是知觉到了,不可能把它还原到更简单的现象。你如果觉得φ运动这个名称有点高深莫测的话,那么想一想我们平时看的电影吧,那一幕幕生动的场景就是φ运动,而它其实就是一连串相继投射在银幕上的静止图片!1912年,他把这些结果发表在他的论文《运动知觉的实验研究》(Experimental Studies of the Perception of Movement)中。后来,人们把这篇论文当作格式塔学派的开山之作。
韦特海默是一位工作狂,43岁时娶了一位年仅22岁的自己的学生为妻。婚前他对未婚妻说:“你必须牢牢记住,我总是不离写字台,我总是在工作。我一定要建立起格式塔理论。”只要想一想,本来去度假的他由于想到一个方法就半途下车一头扎进旅馆房间开始实验,便可以知道他这话一点都没有夸大。
在韦特海默之后,格式塔学派又以知觉的恒常性来支持他们的观点。例如,当我们从不同的地点去看同一扇窗时,尽管它在视网膜上的投影各不相同,但是我们的知觉是不变的。除了这种形状恒常性之外,知觉的恒常性还包括亮度恒常性、大小恒常性,等等。对于所有这些现象,感觉元素变了,但是知觉不变。这些都是对支持知觉体验具有整体性的有力支持。因此在格式塔学派看来,知觉是一个整体,对知觉进行分析或者把其还原成一些元素之和的企图都只会毁了知觉本身。值得说明的是,格式塔概念并不只限于知觉,它可能在学习、思维、情绪和行为等方面都有表现,我们在此就不一一叙述了。
1923年,韦特海默总结了自己及他人的观点,提出把局部元素组织成整体的若干条经验原则,他们把这些经验原则称为“定律”,包括“邻近定律”、“相似定律”“连续性定律”等。在图1-20(A)中有36个黑点,如果我们要把这些黑点看成一些直线的话,那么我们看到的不是横线就是竖线,而不会是对角线,因为对角线的相邻点之间的距离要比竖线或横线相邻点之间的距离大,这就是邻近定律。图1-20(B)则表示“相似性定律”,在这张图中我们看到的总是横线,而不会是竖线,因为横线都是由颜色相同的元素组成的。图1-20(C)表示“连续性定律”,我们总是把上图这些点组成尽可能少的线条,因此我们看到的是中图所示的一条正弦曲线和一串方波,而不会看成下图这样的不规则图形。
图1-20格式塔定律的图解。
神经振荡与同步现象
格式塔学派虽然提出了一些原则来解释人是怎样把局部的元素组织成知觉上的整体的,但是这些都是一些经验规律,丝毫没有涉及脑内的机制是什么。1981年,德国科学家冯·德·马尔斯伯格(C.von der Malsburg)提出了一种理论,认为同一个对象的各种特性所诱发的相应神经活动可能是通过在时间上同步来和同时也有活动的其他神经元区分开的。在他之前,也有人也提出过类似的思想,不过产生的影响没有他大。尽管如此,冯·德·马尔斯伯格的理论仍是一种假设,没有实验根据。直到20世纪80年代末,德国神经科学家辛格(Wolf Singer)才从实验上支持了这种可能性。
1986年,辛格在清醒的可以自由行动的幼猫视皮层里埋置了多个电极,当时他的目的是想看看幼猫在受到短时期单眼剥夺 后皮层神经元感受野有什么变化。但是正如俗语所说:“有意栽花花不发,无心插柳柳成荫。”在实验过程中他们发现:当用移动的方波光栅(即黑白相间的条纹图形)作刺激时,在皮层上分布很远的一些神经元作同步的振荡活动,其振荡频率约为40赫兹,和光栅中的条纹的频率无关。也就是说,这些振荡及其同步性是由内在的神经相互作用引起的。同步振荡现象率先表明了大脑皮层有可能利用时间线索来进行编码。几个月后,格雷(Charles Gray)从美国到辛格的实验室做博士后,本来他是来参与实验室一直从事的有关发育问题的研究的,但因为这一偶然发现而改变初衷。他与辛格实验室的同事们一致认为这一研究更有新意,值得进一步探索。
他们首先通过一系列的实验来重复类似现象,最终发现空间上分离开的神经元发放是否同步取决于光刺激的构型。也就是说,只有当这些神经元受到同一条边界线的刺激,或是光刺激以相同速度和相同方向协调一致地移动时,即刺激来源于同一个整体时,这些神经元的发放才同步。于是,他们提出下列假设:大脑皮层可能是以毫秒级精度利用神经元发放的同步性来把对同一对象起反应的不同神经元的活动“绑定”在一起,以便进一步做后续处理,从而第一次为格式塔学派的知觉组织问题提供了可能的神经生理机制。在一次内部报告会上,辛格实验室向大家报告了他们的研究结果,来自马尔堡大学的埃克霍恩(Reinhard Eckhorn)正是听众之一,他回去后立刻重复了辛格实验室的结果,并且在没有通知辛格实验室的情况下将其抢先发表了。不过现在大家还是普遍承认辛格实验室才是这些结果的发现者,公道自在人心。
后期的研究进一步发现,在相距很远的脑区,甚至在不同的半球之间也能记录到这样的同步活动(但是如果把联系两半球的胼胝体切断了,那么分布在不同半球上的脑区的活动的同步性就消失了)。尽管如此,20世纪90年代初,科学家们在是否存在同步振荡,以及空间上分隔开来的神经元发放的精确同步是否具有功能意义方面仍争论不断。有研究表明同步活动不仅可能由刺激引起,还可能同注意、觉知、认知和执行功能有关。辛格认为,人们之所以对用单细胞记录技术得到的结果争论不休,可能是因为其检测的细胞数太少,从单个细胞上难于检测到瞬息万变而非平稳 的振荡模式。因此许多实验室改用脑电图记录和脑磁图记录的方法,结果发现在β频率和γ频率 的同步振荡活动同诸如知觉组织、集中注意力、工作记忆、多感觉整合、形成联想记忆和感觉运动协调等认知能力密切相关。但我们对这些振荡活动和有关的同步现象的含义仍了解尚浅。
视知觉是如何构建的
早在100多年以前,德国物理学家和生理学家亥姆霍兹在他的《生理光学》( Treatise on Physiological Optics )一书中就指出过,知觉的形成牵涉基于感觉进行归纳推理所产生的某些下意识假设,这些假设是根据个体甚至种系过去的经验形成的。人们通过一系列的错觉现象来论证亥姆霍兹的这一论断。这样的例子举不胜举,下面我们以三个例子为代表。
请看图1-21,图中有三个黑色的缺角圆盘,它们的圆心位置正好处在一个正三角形的三个顶点上,而每个圆盘都缺掉60°的一块扇形区域,而每块这样的区域又正好就覆盖了三角形的三个角。这样人为的安排在自然界中自发出现的概率几乎为零,按照亥姆霍兹的思想,这时脑只能假设有一个白色的正三角形正好遮挡住了这三个圆盘的三块扇形区域。因此,人们就会产生看到了一个白色三角形的错觉,甚至好像还看到了这个三角形的三条完整的边呢。这一错觉按其发明者的名字被命名为卡尼萨三角错觉。
图1-21卡尼萨三角错觉图。
图1-22所示的错觉以其发明人印度裔美国神经科学家拉马钱德兰(V.S.Ramachandran)的名字命名为拉马钱德兰错觉,它甚至比卡尼萨三角错觉更能说明亥姆霍兹的假设。这是一些圆盘,不过左侧9个圆盘的上半部比较亮,而下半部比较暗;右侧9个圆盘则正好相反。当您看这幅图时,您会不由自主地觉得左侧的圆盘向外突起,而右侧的圆盘则下陷。有趣的是,如果您把书颠倒过来看,那么这时左侧的圆盘变成下陷,而右侧的圆盘则成了上凸。为什么会出现这种情况呢?拉马钱德兰的解释是:我们这个世界的自然光源——太阳——在绝大多数时候都高悬头顶,光是从上面照下来的,在这种条件下,凸起物是顶部受到光照,因此发亮,而底部则照不到光,因此发暗;下陷的情况则正好相反。所以,我们总是把上亮下暗的圆盘看成是上凸的,而把上暗下亮的圆盘看成是下陷的。这里面隐含了一条假设:光是从上面照下来的。如果您把图1-22转过90°来看,凹凸就不那么明显了。
图1-22拉马钱德兰错觉图。
图1-23中所示的建筑设计会使您产生一种更奇怪的错觉。图1-23(A)的实线画的是一间形状奇怪的屋子。屋子的前壁和左壁都是正常的长方形,但是后壁和右壁呈直角梯形,而不是像图中用虚线表示的那样为正常的长方形。在前壁的中心有一个小孔,正好能让观察者用一只眼观看屋内的景象。小屋后壁和右壁上的镜框形状都设计得使它们落在视网膜上时正好和虚线所表示的正常墙壁上的长方形镜框落在视网膜上的像一样。由于观察者只能用一只眼睛往里面看,因此就没有双眼视差,观察者也就没有深度感。根据经验,观察者下意识地会假设这是一间正常的屋子。这时如果让两个女孩分别站在屋子的左后角和右后角,由于右后角要比左后角离观察者近得多,因此在那儿的人在视网膜上的投影要大得多。由于观察者下意识地假设了这间屋子是正常的,因此就下意识地推论这两个人和他的距离是相同的。由于右面的人在视网膜上的投影要比左面的人大得多,那么一个下意识的推论就是右面的人要比左面的人高大得多,观察者看到的是如图1-23(B)所示的景象。这个屋子也以其发明者的名字埃姆斯(Adelbert Ames)命名为埃姆斯魔屋。
(A) |
(B) |
图1-23埃姆斯魔屋。
以上这些错觉 的产生都是脑根据个体或种系以往的经验推理的结果,但是在脑作这样的推理时,我们并没有意识到,它就这样自然而然地发生了,这些都支持了亥姆霍兹的理论。格林(I.Glynn)说道:“虽然这类解释并没有告诉我们脑究竟是怎样推理的,但是它们给了我们一些有关脑中所进行的信息处理的可能线索。”克里克(Francis Crick)在他的名著《惊人的假说》( The Astonishing Hypothesis )里有一段非常精辟的论断:“看是一个主动的建构过程。你的大脑可根据先前的经验和眼睛提供的有限而又模糊的信息作出最好的解释。进化可以确保大脑在通常的情况下非常成功地完成这类任务,但情况并非总是如此。心理学家之所以热衷于研究视错觉,就是因为视觉系统的部分功能缺陷恰恰能为揭示该系统的组织方式提供某些有用线索。” 这段话非常清楚地解释了上面所叙述的一切。坎德尔说了同样意思的话:“错觉告诉我们,知觉是脑在解释视觉素材时根据所用的许多假设,下意识地猜测的一种创造性构建的结果。”这一结论虽然已为绝大多数人所承认,但是有关脑是怎么样把输入进来的视觉素材下意识地进行创造性的构建,依然很不清楚。所以在一般人认为十分简单的“看”,其实却非常复杂!克里克晚年的长期合作者科赫(Christof Koch)的话可以作为本章的一个最简要的总结:“我们并不是用眼睛来看的,而完全是用脑来看的。”其实不光是视知觉,其他感知觉又何尝不是如此呢!