我们的身体布满了各种感受器以觉察光线、声音、气味以及与身体的接触。几十亿个神经元对感觉信息进行加工,并将其所发现的信息传递至脑的更高级的中心。本章将集中在感觉系统如何识别我们自身以外的世界。我们将主要阐述视知觉,其次是言语知觉,这是人类最重要的两个知觉系统。
视觉信息加工
脑的视知觉
人类投入大量神经资源来加工视觉信息,这种视觉上的投入是我们“继承”下来的,经过漫长的进化我们有50%的脑都用来进行视觉的加工。
特定脑区的损伤会导致识别困难,例如视觉失认症的出现,它分为统觉失认症和联想失认症。一般认为,统觉失认症病人的视觉系统在早期信息加工中存在问题,联想失认症病人的早期加工完好,但他们在后来的模式识别上存在困难。人们经常会区分视觉流中信息的早期加工和晚期加工,这种区分也是本章的组织原则之一。
以上,视知觉可以分为早期阶段和晚期阶段,在早期阶段将图形和物体从视觉景象中提取出来,在晚期阶段则对图形和物体进行识别。
早期视觉信息加工
神经基础:光线穿过晶状体和玻璃体投射到位于眼后部的视网膜上。视网膜含有光感受器细胞,这些细胞由对光敏感的分子组成,当暴露在光照之下时这些分子会发生结构性的变化。光线在穿过玻璃体时会产生轻微的散射,因此落在视网膜背面的图像并非极其清晰。早期视觉加工的功能之一是锐化图像。
光化学作用将光能转换成神经能。眼睛内有两种不同的光感受器:视锥细胞和视杆细胞。视锥细胞参与颜色视觉,具有高分辨率和高视敏度。视杆细胞能对较弱的光能进行反应,但是它们只具有较低的分辨率。中央凹觉察细节,而其余的视觉区域一一周边视觉区域则察觉比较全局性的信息,包括运动信息。
感受器细胞与两极神经细胞形成突触,两极细胞与神经节细胞相连,神经节细胞的轴突延伸并构成通向脑的视神经。每一只眼睛的视神经中总共约有80万个神经节细胞。每个神经节细胞对来自视网膜的一小块区域的信息进行编码。神经节轴突上的神经脉冲通常是对视网膜上相应区域内的光刺激量的编码。
从眼到脑:来自双眼的视神经在视交又处汇合,而来自视网膜内侧(靠近鼻子的一侧)的视神经彼此交又,然后通向脑的对侧。来自视网膜外侧的神经则继续延伸至与双眼同侧的脑部。
一旦进入脑的内部,来自神经节细胞的神经纤维就与各种皮层下结构的细胞形成突触。这些皮层下神经结构包括外侧膝状体和上丘。外侧膝状体在觉察细节和辨识物体方面有重要作用,而上丘则参与对物体的空间定位。这种区分被称为“什么一哪里”的分工。
视觉世界在初级视皮层上的表征:视觉皮层呈拓扑结构分布。中央凹拥有超大比例的表征,而外围区域的表征却较少。
视觉信息投射到初级视皮层后,它往往会沿着两条通路进行传导。沿“哪里”通路行进的信息传递至顶叶的脑区,沿“什么”通路行进的信息传递至颞叶。
以上,光化学过程将光能转化为神经活动。视觉信息经由各种神经通路传导至视皮层,再从视皮层沿“什么”与“哪里”通路通过大脑。
视细胞中的信息编码
神经节细胞:开-闭细胞和闭-开细胞。
外侧膝状体细胞:开-闭细胞和闭-开细胞。
初级视皮层细胞:这里感受野都是长条形的,而不是前面的圆形感受野。它分为边缘觉察器和直条觉察器;觉察器对应着特定模式的细胞组合。直条和边缘觉察器都与位置、方向及宽度有关。
超柱表征:每个超柱表示感受野中的一个特定区域。视皮层的组织具有拓扑特征,因此视野中相邻的区域由相邻的超柱表征。超柱具有二维组织,沿着一维的方向,各列交替接收来自左眼或右眼的输入;沿着另一维,细胞最敏感的方向发生变化。
视觉系统对物体的不同维度(形状、颜色和运动)分别进行加工。视觉系统似乎将刺激分解成许多独立的特征,并且表征这些特征的位置,视觉特征的这种空间表征被称为特征地图。
以上,神经节细胞通过开-闭细胞和闭-开细胞对视野进行编码,这些细胞通过高层次的视觉加工组合在一起形成各种特征。
深度与表面知觉
即使视觉系统已经识别出环境中的边缘和直条,在它能够知觉到外部世界之前,还必须进行大量的信息加工。必须解决的问题之一是,确定这些边缘和直条的空间位置。这里的根本问题是,投射在视网膜上的信息本身是二维的,而我们需要构建外部世界的三维(3-D)表征。视觉系统对大量线索进行加工以推断距离。这些线索包括了纹理梯度、立体视觉和运动视差。
以上,纹理梯度、立体视觉和运动视差等线索整合在一起,以生成三维空间中各表面位置的表征。
物体知觉
在计算外部世界表征时的一个主要问题是物体的分割。仅仅知道线段和直条在空间的位置还不够,我们还需知道它们如何集合在一起形成物体。
格式塔组织原则:接近原则、相似原则、良好连续原则、闭合及良好构形原则。
识别的关键在于图形的初始分割。
以上,格式塔组织原则解释了脑如何将视觉景象分割成各种物体。
视觉模式识别
对视觉信息加工的讨论已经谈到我们如何将视觉世界组织成客体。然而要理解外部世界还要迈出重要的一步:我们还必须识别这些物体是什么。这项任务就是模式识别。
模板匹配模型
知觉的模板匹配理论认为,物体在视网膜上的影像如实地传到大脑,大脑则将这个图像直接与存储的各种模式进行比较。这些存储的模式被称为模板。其基本思想是,知觉系统将一个物体的图像与脑所存储的每个物体的模板进行比较,然后报告最佳匹配模板。
以上,模板匹配是通过将刺激与模式的模板进行匹配来识别物体的一种方法。
特征分析
鉴于模板匹配遇到的困难,心理学家提出,模式识别是通过特征分析实现的。在这个模型中,刺激被认为是基本特征的组合。
特征分析模型比模板模型的优点在于,首先,由于特征较为简单,因此更容易理解系统是如何克服模板匹配模型在识别完整模式时所面临的各种困难。第二个优点是,有可能指出一个模式中最为重要的特征之间的关系。最后,使用特征而不是较大的模式,减少了所需要的模板数量。
大量行为证据表明,特征是模式识别的组成部分。
以上,特征分析首先识别构成模式的各个特征,然后是它们的组合。
物体识别
虽然特征分析能很好地描述我们如何识别诸如字母A那样的简单物体,但是,人们可能想知道它如何解释我们对复杂物体的识别,这些物体或许是依据少量特征所无法描述的。有证据表明,相同的过程可能出现在识别熟悉物体的时候,例如马或杯子。基本观点是,熟悉的物体可以看成由简单部件组成的已知构形。
基于部件的识别理论:将物体分割成一组基本子物体;对每个子物体进行分类;在识别出了物体的组成部分及它们的构造后,人们就把该物体识别为由这些部分所组成的模式。
这个理论的关键假设是,物体识别是以对其部件的识别为中介而实现的。
以上,像马和杯子之类的物体被识别成一组简单子物体的构形。
脸的识别
识别人脸时,位于颞叶的梭状回变得活跃起来。梭状回专门作出精细辨别。
言语识别
言语识别的一个主要问题是待识别对象的分割。言语不能像打印的文本那样被分成离散的单元,它似乎是连续的声音流,中间没有明显的单词界限。
在一个单词内甚至存在着更大的分割问题。这些单词内的问题涉及到对音素(phonemes)的识别。音素是语音的基本单元,我们借助音素来识别单词。音素被定义为导致口语信息差别的言语的最小单元。然而,在字母与音素之间并非总存在着一一对应的关系,正是字母与读音之间缺乏严格的对应关系才使得英语拼写如此困难。
当需要识别构成所说单词的音素时,分割问题便出现了。困难在于言语是连续的,音素无法像印刷在纸页上的字母那样分开。
言语感知中更进一步的困难在于一种被称为连音的现象。
以上,言语识别包括将音素从连续的言语流中分割出来。
言语的特征分析
就像在视觉识别中那样,特征分析和特征组合的加工似乎也存在于言语知觉中。如同单个字母那样,单个音素可以分解成由许多特征组成。这些特征涉及音素是如何产生的。音素的特征包括辅音特征、浊音音质和发音部位。
以上,音素识别依据的是音素产生过程中的特征,例如发音部位和浊音音质。
类别性知觉
类别性知觉是指对属于不同类别的刺激的知觉,它不能察觉类别内刺激的渐变。
证据:浊音音质研究,辨别研究,自适应范式。
我们所使用的音素是经过选择的,所以它们在言语听觉知觉中存在着类别边界。
知觉系统决定了我们的言语行为,而不是相反。
以上,在连续维度上不同的语音听起来属于不同的类别。
情境与模式识别
物体总是出现在情境中的,而我们可以利用情境来识别物体。整体情境迫使人们获得相应的理解。
当情境或世界的一般性知识指导知觉时,我们将这种加工称为自上而下加工(top-down processing),因为高层次的一般性知识影响着低层次的知觉单元的解释。知觉中的一个普遍问题是,这种自上而下加工与不考虑整体情境而直接对信息本身(来自刺激)进行的自下而上加工(bottom-up processing)是如何结合的。
复杂刺激中存在冗余信息。这些刺激包含了远远多于将一个刺激与另一个刺激区分开所需的特征。因此,当只有部分特征可识别时,知觉也能够成功地进行下去,其余特征可以由情境补充。在语言中,这种冗余信息存在于除特征层次外的许多其他层次上。
以上,在字母识别中,单词情境可以用来补充特征信息。
马萨罗FLMP模型
刺激和情境提供了关于刺激本体的两个独立的信息源,二者组合在一起提供有关刺激可能是什么的最佳猜测。
FLMP模型以上,知觉的马萨罗FLMP模型指出,情境信息与刺激信息各自独立地提供信息,共同决定知觉到的模式。
其他例子
单词识别、音素复位效应、复杂视觉景象、变化盲。
以上,在多种情况下情境信息都会影响知觉加工。
本章讨论了神经元如何加工感觉信息、将其传输到脑内更高级的加工中心以及信息如何被识别为各体。下图给出了视知觉信息加工的整个流程图,它阐明了很重要的一点:在能够意识到我们正在知觉的物体之前,必须要进行大量的信息加工。
视知觉信息加工
网友评论