附录A生物视觉信息处理 A.l人类视觉系统概述 A.1.1人类视觉系统的组成 A.1.2眼球的光学系统 A.1.3视网膜 A.1.4视觉通路 A.2生物视觉信息处理 A.2.1视觉信息的空间域处理 A.2.1.1感受野 A.2.1.2生物视觉系统中的特征检测 A2.1.3侧抑制 A.22生理频率分析器 A.1人类视觉系统概述 人的眼睛可以分辨出只有几十个光子的微弱光线:可以判断出垂直线不到1度的倾斜 可以引导人们穿过拥挤的路口:还可以认出图画中物体的名称等。总之眼睛具有许多功能 中国人甚至还有“眼见为实”的谚语。当然,这里所说的眼睛事实上是指眼一脑系统。眼- 脑系统在完成上述这些视觉功能时涉及不同的视觉信息处理过程。人的视觉处理过程的特点 是它是一个从低到高的分层结构。例如,从一幅图画中认出图中的物体就需要不同层次的信 息处理。首先要分辨出表示物体的线条,这涉及低层的视觉信息处理;根据以往的知识和经 验,经过符号解释识别物体的类别就涉及高层的处理。对人类视觉的研究就是试图分辨这些 层次,弄清各个层次所起的作用。为此要进行各种实验研究。在这里我们所感兴趣的是对人 类视觉进行的心理物理学( psychophysical)和神经生理学( neurophysiology)实验;以及这 些实验结果对计算机视觉研究的影响。为了便于区分这两种实验的研究领域,我们来分析 下眼睛和大脑细胞对输入刺激的响应情况。如图A.1所示,生物视觉系统的研究可分成二个 层次。第一层是关于单个神经细胞的特性。它研究当受到某种输入信号的刺激时单个细胞的 反应模式。这是神经生理学主要的研究内容。一般来说,神经生理学主要研究单个或一小簇 神经细胞的行为。这时通常要实验量测神经细胞对输入信号所作的编码输出。其中可能包括 输出编码信号的空间位置、作用频率、响应幅度等。当然,这些神 人值中楼经中神网 L神经生理学 心理物理学 图A.1生物视觉系统的研究层次 经细胞是相互联系,共同配合产生输出的,特别在高层的视觉处理中更是这样的。但要研究 神经网络中的这些细胞是如何相互影响和作用是非常困难的。神经网络对视觉信息处理的作 用是生物视觉系统研究中的第二个层次。对这个层次的研究仅仅是建立在发现输入信息与感
207 附录 A 生物视觉信息处理 A.1 人类视觉系统概述 A.1.1 人类视觉系统的组成 A.1.2 眼球的光学系统 A.1.3 视网膜 A.1.4 视觉通路 A.2 生物视觉信息处理 A.2.1 视觉信息的空间域处理 A.2.1.1 感受野 A.2.1.2 生物视觉系统中的特征检测 A.2.1.3 侧抑制 A.2.2 生理频率分析器 A.1 人类视觉系统概述 人的眼睛可以分辨出只有几十个光子的微弱光线;可以判断出垂直线不到 1 度的倾斜, 可以引导人们穿过拥挤的路口;还可以认出图画中物体的名称等。总之眼睛具有许多功能, 中国人甚至还有“眼见为实”的谚语。当然,这里所说的眼睛事实上是指眼—脑系统。眼— 脑系统在完成上述这些视觉功能时涉及不同的视觉信息处理过程。人的视觉处理过程的特点 是它是一个从低到高的分层结构。例如,从一幅图画中认出图中的物体就需要不同层次的信 息处理。首先要分辨出表示物体的线条,这涉及低层的视觉信息处理;根据以往的知识和经 验,经过符号解释识别物体的类别就涉及高层的处理。对人类视觉的研究就是试图分辨这些 层次,弄清各个层次所起的作用。为此要进行各种实验研究。在这里我们所感兴趣的是对人 类视觉进行的心理物理学(psychophysical)和神经生理学(neurophysiology)实验;以及这 些实验结果对计算机视觉研究的影响。为了便于区分这两种实验的研究领域,我们来分析一 下眼睛和大脑细胞对输入刺激的响应情况。如图 A.1 所示,生物视觉系统的研究可分成二个 层次。第一层是关于单个神经细胞的特性。它研究当受到某种输入信号的刺激时单个细胞的 反应模式。这是神经生理学主要的研究内容。一般来说,神经生理学主要研究单个或一小簇 神经细胞的行为。这时通常要实验量测神经细胞对输入信号所作的编码输出。其中可能包括 输出编码信号的空间位置、作用频率、响应幅度等。当然,这些神 图 A.1 生物视觉系统的研究层次 经细胞是相互联系,共同配合产生输出的,特别在高层的视觉处理中更是这样的。但要研究 神经网络中的这些细胞是如何相互影响和作用是非常困难的。神经网络对视觉信息处理的作 用是生物视觉系统研究中的第二个层次。对这个层次的研究仅仅是建立在发现输入信息与感 单神经元 层次 输入信号 细胞组织 神经网络 感知输出 神经生理学 心理物理学
知输出之间对应关系的基础上,这就是经典的黑箱实验的方法。这第二个研究层次就是心理 物理学的研究范围 我们在这里粗略介绍人类视觉生理的目的是为了向计算机领域的科技人员提供有关背 景知识和材料。因此在许多地方为方便起见采用方块图的表示方法。此外,限于篇幅我们着 重介绍与马尔的视觉计算理论有关的内容 A11人类视觉系统的组成 我们可以把人类视觉系统看成一个有生命的光学变换器和信息处理系统。眼睛就是光学 变换器,并能进行部分处理工作。事实上在进化阶段上越是低级的生物,它们的眼睛越担负 更多的处理功能。为便于说明可把视觉系统分成三部分(图A.2)。这三部分都相当复杂, 但相比而言,第一部分,光学系统,由于有关的神经活动最少,因此最为简单;第二部分是 视网膜。它把光信号转变成电信号,并进行某些细胞一级的处理。第一、第二两部分都在眼 睛里。最后一层是视觉通路,它实质上是代表从视网膜到大脑皮层的视觉通路上所完成的复 杂处理的统称。 在大脑和到大 在眼中 脑的通路中 输入图象光学系统[光信号视网膜[电信号丬视觉通路[感知 传导 处理 图A2视觉系统的组成 A.12眼球的光学系统 人眼的外形接近球形,是一个直径为24毫米的球状体,又称为眼球。眼球壁由巩膜、 脉络膜和视网膜组成(图A.3)。巩膜在眼球壁最外面,它主要起着巩固、保护眼球的作用 巩膜前面有六分之一是透明的,这部分称为角膜。角膜厚度约为1毫米,直径为11毫米 它好象是眼睛的玻璃窗户。光线由角膜射入眼内 緣带 能卖肌 小带纤 先 图A.3人眼模式图 208
208 知输出之间对应关系的基础上,这就是经典的黑箱实验的方法。这第二个研究层次就是心理 物理学的研究范围。 我们在这里粗略介绍人类视觉生理的目的是为了向计算机领域的科技人员提供有关背 景知识和材料。因此在许多地方为方便起见采用方块图的表示方法。此外,限于篇幅我们着 重介绍与马尔的视觉计算理论有关的内容。 A.1.1 人类视觉系统的组成 我们可以把人类视觉系统看成一个有生命的光学变换器和信息处理系统。眼睛就是光学 变换器,并能进行部分处理工作。事实上在进化阶段上越是低级的生物,它们的眼睛越担负 更多的处理功能。为便于说明可把视觉系统分成三部分(图 A..2)。这三部分都相当复杂, 但相比而言,第一部分,光学系统,由于有关的神经活动最少,因此最为简单;第二部分是 视网膜。它把光信号转变成电信号,并进行某些细胞一级的处理。第一、第二两部分都在眼 睛里。最后一层是视觉通路,它实质上是代表从视网膜到大脑皮层的视觉通路上所完成的复 杂处理的统称。 图 A.2 视觉系统的组成 A.1.2 眼球的光学系统 人眼的外形接近球形,是一个直径为 24 毫米的球状体,又称为眼球。眼球壁由巩膜、 脉络膜和视网膜组成(图 A.3)。巩膜在眼球壁最外面,它主要起着巩固、保护眼球的作用。 巩膜前面有六分之一是透明的,这部分称为角膜。角膜厚度约为 1 毫米,直径为 11 毫米, 它好象是眼睛的玻璃窗户。光线由角膜射入眼内。 图 A.3 人眼模式图 光学系统 视网膜 视觉通路 感知 在大脑和到大 在眼中 脑的通路中 输入图象 光信号 电信号 传导 处理
脉络膜紧贴巩膜,起输送养料、滋养眼睛的作用。脉络膜最前面的环状部分为虹膜。眼 的颜色由虹膜中的色素决定。虹膜中央有一个小圆孔,叫做瞳孔。瞳孔能控制进入眼内的光 量,它可随光线的强弱而扩大或缩小,起照相机光圈的作用 虹膜后面为水晶体,它是透明的胶状体,并富有弹性。它将光线聚焦到视网膜上。角膜 与虹膜之间的空间为前房,位于虹膜和水晶体之间的空间为后房。这两个房都充满水样液 水晶体后面的空间充满着叫玻璃体的液体。 眼球的第三层是视网膜,约占眼球内表面的2/3。它含有感光细胞(杆体细胞和锥体细 胞)。从眼睛的构造可知,它的光路是由以下几部分组成:角膜、水样液、虹膜、瞳孔、水 晶体和玻璃体等。光线通过角膜进行眼球,然后经过水样液到达虹膜。虹膜上的瞳孔随着光 线的强度变化它的孔径大小(从2毫米到8毫米)。强光时缩小、弱光时扩大。光线通过瞳 孔后经过水晶体和玻璃体最后到达视网膜。水晶体和玻璃体各有不同的折射率以确何在视网 膜上得到清晰的成象。眼睛的感光系统就是视网膜,它如同照相机的底片。 RocEs Cones 食坚少 TAmari 〔 a Logion cell 图A4视网膜剖面图
209 脉络膜紧贴巩膜,起输送养料、滋养眼睛的作用。脉络膜最前面的环状部分为虹膜。眼 的颜色由虹膜中的色素决定。虹膜中央有一个小圆孔,叫做瞳孔。瞳孔能控制进入眼内的光 量,它可随光线的强弱而扩大或缩小,起照相机光圈的作用。 虹膜后面为水晶体,它是透明的胶状体,并富有弹性。它将光线聚焦到视网膜上。角膜 与虹膜之间的空间为前房,位于虹膜和水晶体之间的空间为后房。这两个房都充满水样液。 水晶体后面的空间充满着叫玻璃体的液体。 眼球的第三层是视网膜,约占眼球内表面的 2/3。它含有感光细胞(杆体细胞和锥体细 胞)。从眼睛的构造可知,它的光路是由以下几部分组成:角膜、水样液、虹膜、瞳孔、水 晶体和玻璃体等。光线通过角膜进行眼球,然后经过水样液到达虹膜。虹膜上的瞳孔随着光 线的强度变化它的孔径大小(从 2 毫米到 8 毫米)。强光时缩小、弱光时扩大。光线通过瞳 孔后经过水晶体和玻璃体最后到达视网膜。水晶体和玻璃体各有不同的折射率以确何在视网 膜上得到清晰的成象。眼睛的感光系统就是视网膜,它如同照相机的底片。 图 A.4 视网膜剖面图
A13视网膜一光电接收器 视网膜的剖面如图A4所示。它包含感光细胞,双极细胞和神经节细胞。视网膜厚度约 为1-0.5毫米。从组织学上可分成10层。但通常可分成三个层次:(1)感光细胞,即杆体细 胞和锥体细胞。锥体细胞是明视器官,它在光亮条件下发生作用,能分辨细节。杆体细胞是 暗视器官对弱光反应灵敏,在低照明情况下发生作用。但它不能感受颜色,对精细物象的辨 别也没有什么贡献。(2)双极细胞。锥体细胞和杆体细胞与双极细胞连接。一般情况是每一 个锥体细胞与一个双极细胞连接,这是为了在光亮条件下便于精细地感受外界的刺激。而杆 体细胞往往是几十个连接到一个双极细胞。这是为了在黑暗条件下能汇集外界微弱的光刺 激。(3)神经节细胞。其细胞的视觉纤维通向大脑,总共有80万个。 在人的视网膜上正对着瞳孔的中央有一个直径为20毫米的黄色区域,叫黄斑。在黄斑 中间有一个小凹,直径为0.4毫米,这是视觉最敏锐的地方。视网膜上总共有一亿二十四万 个杆体细胞和700多万个锥体细胞,主要集中在中央凹附近。在以中央凹为中心大约3度视 角范围内只有锥体细胞,几乎不存在杆体细胞。在黄斑以外,杆体细胞数量增多,而锥体细 胞数量减少。在距中央凹4毫米的鼻侧处是视神经进入眼球内的地方,此处既没有杆体细胞, 也没有锥体细胞。因此,视网膜上这一点是没有光感受的,叫做盲点。 dt'lierte 164) =4 Nasal re: lin 图A5锥体细胞和杆体细胞的分布 210
210 A.1.3 视网膜—光电接收器 视网膜的剖面如图 A.4 所示。它包含感光细胞,双极细胞和神经节细胞。视网膜厚度约 为 1-0.5 毫米。从组织学上可分成 10 层。但通常可分成三个层次:(1) 感光细胞,即杆体细 胞和锥体细胞。锥体细胞是明视器官,它在光亮条件下发生作用,能分辨细节。杆体细胞是 暗视器官对弱光反应灵敏,在低照明情况下发生作用。但它不能感受颜色,对精细物象的辨 别也没有什么贡献。(2) 双极细胞。锥体细胞和杆体细胞与双极细胞连接。一般情况是每一 个锥体细胞与一个双极细胞连接,这是为了在光亮条件下便于精细地感受外界的刺激。而杆 体细胞往往是几十个连接到一个双极细胞。这是为了在黑暗条件下能汇集外界微弱的光刺 激。(3)神经节细胞。其细胞的视觉纤维通向大脑,总共有 80 万个。 在人的视网膜上正对着瞳孔的中央有一个直径为 2.0 毫米的黄色区域,叫黄斑。在黄斑 中间有一个小凹,直径为 0.4 毫米,这是视觉最敏锐的地方。视网膜上总共有一亿二十四万 个杆体细胞和 700 多万个锥体细胞,主要集中在中央凹附近。在以中央凹为中心大约 3 度视 角范围内只有锥体细胞,几乎不存在杆体细胞。在黄斑以外,杆体细胞数量增多,而锥体细 胞数量减少。在距中央凹 4 毫米的鼻侧处是视神经进入眼球内的地方,此处既没有杆体细胞, 也没有锥体细胞。因此,视网膜上这一点是没有光感受的,叫做盲点。 图 A.5 锥体细胞和杆体细胞的分布
A.14视觉通路 光线通过眼球的光学系统到达视网膜,视网膜上的感光细胞完成光电信号的转换,其中 的双极细胞和神经节细胞已涉及某些低层次的处理。这一节将介绍在此以后主要的视觉信息 传导通路。在传导过程中神经细胞对视觉信息进行了不同层次的处理。进行信息处理并且和 其它细胞相互联系的神经细胞称为神经元。 神经元有各种形状,在大脑和小脑内密度为数万/毫米3。其基本形状为从细胞体发出 的突起。其中有一根细长的称为“轴突”或神经纤维,其它多数比较粗短的突起称为“树突” 轴突是把细胞体的兴奋传给其它神经元的通路。它的前部有分枝,而末稍与其它神经元的树 突或细胞体相接触,此接触点称为“突触” 神经元外面包有细胞膜。通常细胞膜内保持比细胞膜外负70毫伏的静息电位。但当细 胞兴奋时它就放出振幅为100毫伏,持续时间不到1毫秒的脉冲电位。此脉冲电位可沿轴突 传送 k服 哭 图A6神经元的结构 当给神经元强刺激时产生脉冲的频率增加,而脉冲的形状和振幅大体恒定, 轴突与其他神经元细胞体或树突相接触处有15~50纳米的间隙,因此两者在电学上是 相互断开的。当脉冲到达轴突的末稍时就向突触间隙释放乙酰胆碱一类的化学物质。由于这 种化学物质的作用,突触后细胞膜的离子通透性发生变化。因此就产生正的或负的电位。这 种突触后产生的电压称为“突触后电位” 视觉通路的传导从视网膜上神经节细胞层的一级神经元开始。一级神经元的轴突形成视 神经即“视東”。视束的神经纤维分成三个子束。一束来自外侧(颞侧)的半个视网膜;另 束来自内侧(鼻侧)的半个视网膜;第三束来自视网膜的中央部分。人的视束纤维在其往 后的过程中有一部分发生交叉一即来自每一视网膜鼻半侧的纤维在视交叉处交叉,而来自视 网膜颞侧部分的神经纤维不交叉(图A.7)。交叉的纤维与另一颞半侧不交叉的纤维合并后 211
211 A.1.4 视觉通路 光线通过眼球的光学系统到达视网膜,视网膜上的感光细胞完成光电信号的转换,其中 的双极细胞和神经节细胞已涉及某些低层次的处理。这一节将介绍在此以后主要的视觉信息 传导通路。在传导过程中神经细胞对视觉信息进行了不同层次的处理。进行信息处理并且和 其它细胞相互联系的神经细胞称为神经元。 神经元有各种形状,在大脑和小脑内密度为数万/毫米 3。其基本形状为从细胞体发出 的突起。其中有一根细长的称为“轴突”或神经纤维,其它多数比较粗短的突起称为“树突”。 轴突是把细胞体的兴奋传给其它神经元的通路。它的前部有分枝,而末稍与其它神经元的树 突或细胞体相接触,此接触点称为“突触”。 神经元外面包有细胞膜。通常细胞膜内保持比细胞膜外负 70 毫伏的静息电位。但当细 胞兴奋时它就放出振幅为 100 毫伏,持续时间不到 1 毫秒的脉冲电位。此脉冲电位可沿轴突 传送。 图 A.6 神经元的结构 当给神经元强刺激时产生脉冲的频率增加,而脉冲的形状和振幅大体恒定。 轴突与其他神经元细胞体或树突相接触处有 15~50 纳米的间隙,因此两者在电学上是 相互断开的。当脉冲到达轴突的末稍时就向突触间隙释放乙酰胆碱一类的化学物质。由于这 种化学物质的作用,突触后细胞膜的离子通透性发生变化。因此就产生正的或负的电位。这 种突触后产生的电压称为“突触后电位”。 视觉通路的传导从视网膜上神经节细胞层的一级神经元开始。一级神经元的轴突形成视 神经即“视束”。视束的神经纤维分成三个子束。一束来自外侧(颞侧)的半个视网膜;另 一束来自内侧(鼻侧)的半个视网膜;第三束来自视网膜的中央部分。人的视束纤维在其往 后的过程中有一部分发生交叉—即来自每一视网膜鼻半侧的纤维在视交叉处交叉,而来自视 网膜颞侧部分的神经纤维不交叉(图 A.7)。交叉的纤维与另一颞半侧不交叉的纤维合并后