基于部件的识别理论
结构描述理论和观察者概念是人类心理学中发展出的两种最突出的物体识别框架。结构描述理论认为,仅仅观察物体的轮廓就足以识别物体。与之相反,观察者方法提出,所有实体的特征都被记住,即使它们对识别并不重要。
什么是基于部件的识别理论?
Irving Biederman于1987年提出了基于部件的识别概念(RBC),以解释物体识别过程。基于部件的识别理论指出,要理解任何事物,都必须将其分解成其组成部分或几何元。如果您熟悉Biederman的基于部件的识别理论,您就会知道几何元是代表实体最简单部分的平面或三维形状。不同形状的几何元,例如圆柱体和圆锥体。它们可以以不同的方式组合,构成无数种不同的物体。基于物体由其组成部分识别的概念,每个人每天遇到的物体都由少于35种表征组成。
处理阶段
有一些过程可以识别物体或部件。这些阶段被认为是级联排列的。早期的边缘提取阶段对表面特征(如亮度、纹理或颜色)的差异很敏感,并提供物体的线图解释。部件的位置类似于记忆中的表征,并且假定匹配是并行发生的,具有无限的能力。这个阶段模型已经被提出,以提供一个总体的理论背景。当物体的图像投射到视网膜上时,基于部件的识别模型假设它是一个分割图像的表示。然后,每个分割区域都被近似为一组可能的简单部件之一,称为几何元,可以用广义圆锥体建模。基于部件的识别的基本感知假设是,部件可以基于二维图像中易于检测到的感知特性来区分。因此,基于部件的识别提供了对感知组织和模式识别之间经典现象关系的原理性解释。
颜色和纹理
之前的解释主要基于边缘。像颜色、亮度和纹理这样的表面特征通常在原始访问中只扮演次要角色。这应该解释为除了暗示表面特征的识别相对于部件的感知固有地延迟之外的其他内容。然而,在大多数情况下,表面特征通常是访问计数项目的划分效率较低的途径。例如,椅子同时具有特定的颜色和纹理以及其部分解释,但这只是体积解释,它可以有效地访问椅子的心理表征。
部件之间的关系
相似部件的不同位置很容易导致不同的物体。原始物及其排列之间的相同情况存在于单词的音素表示中,其中给定的音素部分可以重新排列以构成不同的单词。物体的表示将是表达部件之间关系的结构描述。这些关系包括部件的相对大小、方向及其连接位置的规范。
实验证据
实验参与者表现出非凡的能力,即使在视觉噪声的情况下也能理解物体,只要几何元可见。
特征关系数据的去除是几何元损坏与物体识别之间的关系。
即使在试验之间使用不同的几何元,也不存在视觉简短。
该理论的优势和劣势
使用几何元作为结构原始具有两个主要优点。因为几何元是基于在不同视角下一致的物体属性建立的,所以所有几何元都可以被视为独特或独一无二的。单个几何元描述足以从所有可能的视角解释一个物体。基于部件的识别理论的第二个好处是它实现了显著的表征经济性。数量有限的几何元组合产生一个简单的字母表,可以从复杂的事物中产生。例如,仅使用24个几何元,3060亿个三个几何元的组合就允许理解所有可能的事物。基于部件的识别理论本身无法从真实物体的照片开始,并创建该物体的几何元和关系描述。基于部件的识别理论并没有试图提供机制来降低现实场景的复杂性到简单的几何形状。基于部件的识别理论本身无法获取真实物体的快照并提供该物体的几何元和关系描述。基于部件的识别理论并没有试图提供机制来降低现实世界场景的复杂性到基本的几何形状。在这些几何元中,必须满足基于部件的识别理论,并且它们之间的关系只能在许多真实物体之间才能辨别。例如,梨和苹果很容易被人区分,但缺乏基于部件的识别理论所需的角和边来理解它们的差异。Biederman还认为,这种差异解释了研究结果,即物体的理解在视角变化时可能不会同样好。
优势 | 劣势 |
---|---|
使用几何元作为结构原始带来两个主要优势。 |
相对较少数量的几何元形成了一个简单的字母表,可以从复杂物体中产生。 |
结论
根据上述解释,Irving Biederman在1987年建立了基于部件的识别理论,这表明人类可以通过将物体分解成几何元来理解物体。已经研究了处理阶段、颜色、纹理、部件之间的关系以及基于部件的识别理论的优缺点。基于部件的识别理论是有用的,因为它允许我们独立于视角来理解物体。这也称为视角不变性。几何元的非变边缘特征是这种现象的原因。