视觉词语识别:应用意义
阅读是一项非凡的人类成就,因为它涉及到一系列感知和心理过程的同步掌握,从基本的感官理解到词汇项目的接受、单词流畅性、角膜控制,以及恢复书面文字意义所需的所有高级语言过程。除了难以将每种方法区分开来之外,弄清楚它们如何结合在一起发挥作用的复杂性也是巨大的。早期的阅读模型通常是“盒子和箭头”式的。
视觉词语接受的意义
当代图形词语接受理论普遍认为,单词是根据其组成部分(例如,在整合方法中)分层识别的,尽管视觉视词语的最早假设声称短语是根据其形状整体识别的。构成字母的光学特征(例如水平条)在记忆中表示,并且此信息被映射到记忆中的字母表示中。一些假设提出,在大脑激活单个字母的记忆后,接下来会激活正字法韵律、词素和音节的术语,并最终激活存储在字母词典中的已知完整单词形式的记忆。
逐词接受
大多数关于视觉词语接受的观点都集中在一旦其独特的正字法词典表示被激活到一定阈值时识别单个单词。近年来,由于一种独特的去中心化分布式概念理论,我们在理解将正字法转换为语音并映射拼写到意义的过程中取得了重大进展。
贝叶斯定理
一种数学方法,用于根据新信息修改概率或信念的估计。词语接受基于一个公式,该公式计算给定可用证据的术语的可能性。
P(word/evidence) = P(word) $\times$ P(evidence|word)
$\mathrm{\sum i = 0 \: i = n}$ [P(wordi) $\times$ P(evidence|wordi)]
连接主义
描述在人工神经网络中表示的模型,例如 IA 模型。这些模型旨在表示神经元或神经元组共享的广泛特征。
交互激活模型 (IA)
词语接受的开创性连接主义方法至今仍是黄金标准。在这个网络模型中,单词通过弱连接相互抑制。
词典比较
在 IA 和贝叶斯模型中,相邻单词相互竞争以获得接受。这是因为 IA 模型中单词节点之间存在抑制连接。
词汇意义的解释
在实验室中研究词语接受的黄金标准。参与者需要确定给定的一组字符是否代表一个有效的单词。
高人口密度
对单词与其他单词语料库相似性的统计评估。在评估单词时,通常会计算通过仅更改一个字母可以生成多少个新单词。根据此概念,不同长度的单词不能成为近邻,而莱文斯坦距离是一种更通用的度量。将“编辑”(插入、删除和替换)的数量用作相似性的度量;因此,单词和WORDS现在被视为近亲。OLD20 度量 20 个邻居的平均距离。
为什么要使用“计算”模型?
基于计算的模型几乎完全用于阅读研究。这适用于口语词语接受模型 20、21,以及词语接受概念 2、3、4、5、6、7、8、9、10、11、广泛阅读 12、13、14、15、形态学以及阅读文本时的注视 17、18、19。计算机模拟如何成为标准方法?重要的是要记住,模型的基本思想通常很简单。即使理论家完全掌握了模型的基本概念和数学基础,他们仍然需要确定模型的行为。
模型的形式化
早期的连接主义或“神经网络”认知模型之一,交互激活 (IA) 范式 11、22 是迄今为止最重要和最具开创性的计算机建模类型。几乎所有 IA 模型都使用“局部主义”表示,其中字母特征、字符和单词被描绘成一个节点网络。大多数 IA 网络无法学习。尽管 IA 模型(如空间编码模型和双通路级联 (DRC) 模型)持续取得成功,但许多连接主义模型包含学习过程并使用“分布式表示”。
空间编码模型
基于 IA 框架的是地理空间编码模型 (SCM)。第一个 IA 模型仅支持模拟单个长度的单词。除了处理不同大小的单词外,SCM 实际上也已升级以模拟掩蔽启动。
单词之战
词语接受要求读者积累足够的信息以将目标词语与其词汇邻居区分开来,这些邻居具有一些感知上的相似性。发音相似的单词必须争夺注意力。尽管所有现有模型的基础竞争过程在模型中似乎有所不同,但产生的行为却似乎具有可比性,但词汇竞争是所有这些模型不可或缺的一部分。
实验室项目
视词模型试图解释在常规阅读过程中发生了什么,但在实践中,读者唯一明显的动作是眼球运动。通过观察受试者眼球运动获得的见解可能是深刻的;此外,仅在使用经过良好控制的刺激才能收集足够的数据。因此,许多科学家专注于词汇选择、单词识别和掩蔽启动,因为这些更容易在实验室中进行研究。由此产生了两个独立的建模业务。阅读中的眼球控制模型通常简化了关于如何检测词汇项目的含义(17、18、19),而词语接受模型很少探讨它们如何与阅读模型相关联。实验室工作为建模增加了新的复杂维度。很容易将诸如词汇决策之类的测试误认为是对识别单词所需时间的直接评估。但是,实际上,每个活动都需要自己独特的一组认知资源。模型必须能够很好地匹配数据,因此需要任务性能和单词识别模拟。
结论
视网膜词语接受理论是最广泛接受的,当字母词典中的某个特定图像被激活到足够程度时,就会发生词语接受。基于分布式连接主义概念的另一种思想流派极大地影响了我们对参与将正字法转换为语音和映射正字法到意义的系统的了解。在某种程度上,我们对阅读的理解可以归因于这些模型。虽然这些模型在阐明如何学习准规则映射方面非常宝贵,但它们在描述人们在最流行的视觉词语接受测试中的表现方面却收效甚微。