心理测试中适当规范的必要性

从事研究或其他学术调查的人员致力于测量一个概念，然后将其结果推广到整个人群。但是，这项看似不可能的任务是如何实现的呢？个体差异构成了心理学的核心。在心理学中，我们努力弄清人们的不同之处，同时找出他们的一些共同点。我们在心理学中以系统和科学的方式研究行为。此外，行为是根据其表现来研究的。

心理测试中适当规范的必要性

规范是指个体在特定指标上的表现与特定基准的总体表现相比的情况的细节。规范指的是标准化测试结果。分析心理测试结果最常见的方法是与规范进行比较，这显示了测试在标准化样本中的表现如何。规范象征着在所有情况下最高的绩效。18 世纪，弗朗西斯·高尔顿爵士首次提出了基于规范的评估的原理。

使能够评估测试相对受试者位置的事实被称为测试规范。例如，与评分关键相符的响应百分比是受试者原始分数的度量，但此数字毫无意义。测试结果几乎总是必须被解读为揭示受试者与其他组成员的立场。规范为我们将一个人与一个群体进行比较提供了一个框架。规范有两个目的

规范指示个体在规范样本中的相对位置，这使得能够将个体的表现与其他人进行比较。
规范提供可比较的测量，使可以直接比较个体在不同测试上的成就。

统计规范在心理测试中的重要性

它可以在以下标题下进行研究：

频率分布

统计技术的主要目标是组织和总结定量数据，以便于理解。列出 1000 个发现可能会令人望而生畏，这就是沟通的意义很小的地方。通过将结果制表成频率分布，可以采取第一步来恢复这种混乱的原始数据的结构。通过将分数分成易于管理的类别区间并计算每个区间中的每个分数来创建分布。

一旦所有结果都记录下来，就对计数进行汇总以确定每个类别区间内的频率或实例数。组中的实例总数 N 将等于这些频率的总和。

图形表示

分散曲线可以图形化地描述频率分布中的数据。分数按阈值或水平轴上的类别区间组织，频率或每个类别区间中的实例数放在垂直轴上。该图有两个不同的图。

直方图中叠加在该区间上的列的高度表示每个类别区间中得分的人数。在频率多边形中，一个点位于类别区间的中心，直接与相关频率相对，表示每个区间中的人数。然后绘制线以连接后续的点。

集中趋势

一组值可以根据任何集中趋势度量进行分类。平均值或平均值 (M) 是这些度量中最常用的，它是通过将所有分数加起来并将其总数除以实例数 (N) 来计算的。众数或最常见的分数是另一个度量。

在频率分布中，众数是指具有最高频率的指定范围的中间点。当所有分数按大小顺序排列时，中位数或中间分数是集中趋势的第三个指标。一半的案例位于中位数之上和之下，中位数将分布分成两半。

变异性

方差的测量值，或围绕集中趋势的个体差异的大小，用于彻底描述一组测试结果。以最佳值和最低值之间的差异来显示变异性代表了最透明和最众所周知的方法。然而，范围仅由两个分数定义，使其极其不稳定和原始。这意味着单个异常大的结果或不良结果会显着改变其大小。每个人得分与组平均值之间的差异，是变异性的更准确衡量标准。

发展规范

它包括：

心理年龄

提供有意义的测试结果的一种方法是显示该人在典型的发育轨迹中取得了多大的进步。发展系统在执行特定任务（例如感知操作或概念形成）时使用更多对行为的定性描述。尽管比内本人更喜欢更不带偏见的词“智力水平”，但“心理年龄”一词却通过比内-西蒙量表的替代含义和解释而被普遍使用。

项目组基于像 Bind 及其更新（1986 年之前）这样的年龄量表中的年份。例如，标准化样本中大多数 7 岁参与者通过的项目被归类为 7 岁类别，依此类推。因此，孩子的测试结果将表明他们可以达到的最高年级。在实际应用中，这个人未能通过某些低于其心理成熟度的测试，并在某些高于其心理成熟度的测试中成功。因此，通常的做法是确定基础年龄，即通过所有考试的年龄。

随后，以月为单位对在更高年龄等级达到的所有评估给予部分学分，这些学分随后添加到此基础年龄中。心理年龄标准也已用于未按年级划分的评估。在这种情况下，首先计算孩子的原始分数。

此类测试的成熟度规范是标准化样本中每个年龄类别内的儿童获得的平均定量证据。例如，如果根据 8 岁儿童的平均测试统计数据，某人的评估心理成熟度为 8 岁。通过使用年龄规范，可以类似地处理任何原始测试分数。

年级等值

学术成绩考试中的分数通常转换为年级等值。计算每个年级学生获得的平均原始分数以确定年级规范。因此，如果标准化样本中四年级学生的数学测试中正确解答问题的平均数为 23，则原始分数 23 等同于 4 年级。

插值通常用于确定中间年级等值，表示分数的几分之一。同时，也可以通过在学年中的不同时间点评估学生来直接获得这些结果。例如，四年级开始时的平均成绩为 4.0。如果测试使用者需要清楚地记住年级规范是如何确定的，他们也可能会误解。

序数测量

他们通过特定的行为功能来确定孩子的发育阶段。即使分数可能以大致的年龄范围提供，但首先是对孩子的特征和行为的描述性设计。此类量表通常暗示通过一系列阶段进行统一的发展演变。这些量表与域参照评估共享重要特征，因为它们通常提供有关儿童完全能够做什么的详细信息（例如，无需支撑即可攀爬坡道；在将液体浇入不同大小的容器时识别液体的体积差异）。

适当的规范告诉我们什么？

它包括：

个体与同一类别中其他人的相对表现
比较标准
一种评估自我并提供改进方法的方式
为相同人口统计特征的个人设定理想化的目标
在高风险测试决策中的测试公平性
根据证据进行预测
对获得的测试分数进行有意义的解释

结论

测试“常模”是提供给随后将进行相同评估的相关学习者样本的标准化考试结果。常模为教师提供了一种工具，可以了解学生在特定年级的正常（或平均）成绩。此外，常模还显示与每个分数相关的百分位等级以及每个年级所有潜在测试分数的范围。常模揭示了所有学生在考试中的相对成绩，无论他们的成绩是低、中还是高。在这种特定情况下，教师可以使用常模来确定每个学生的胜任力水平与其他学生相比，并确定哪些学生需要补习、标准或加速教学。

Utkarsh Shukla

更新于：2023年2月10日

448 次浏览

开启你的职业生涯

完成课程获得认证

开始学习