少数族裔群体测试偏差
心理学家在各种情境中出于各种目的使用测试和评估,包括但不限于工作安置、诊断心理疾病以进行心理健康治疗、核实健康保险范围、进行市场调研焦点小组、为法律决策和政府政策提供信息以及制定可靠评估人格特征的措施。
美国心理学会 (APA) 的《心理学家伦理原则和行为规范》(2002) 和《教育和心理测试标准》为对种族/民族少数群体进行心理测试和评估的道德行为提供了指导。
测试偏差
与美国教育研究协会、美国心理学会和全国教育测量委员会类似,测试偏差被定义为维度上的系统性错误,并体现了这样一个概念:存在一些与结构无关的因素会影响所考察群体的维度高级或低级分数。因此,偏差是在特定语境下使用的。偏差是维度过程中的一种系统性不准确性,它对相关群体的影响不同。测试中的偏差可能是内部的(心理测量成分、测试结构)或外部的(歧视性抽样/选择)。此外,内部和外部偏差可能同时存在于同一个测试中。
测试偏差类型
以下是测试偏差的一般类别:
结构效度偏差 - 这指的是测试是否直接测量了其设计目标。例如,在一项智力测试中,正在学习英语的学者可能会遇到他们尚未学习的单词。因此,测试结果可能反映出他们相当薄弱的英语能力,而不是他们的学术或智力能力。
内容效度偏差 - 当测试的内容对一组学者比对其他学者相对更难时,就会出现这种偏差。例如,当学生群体(例如不同年龄组)没有获得相同的学习测试材料的机会时,当评分对某个群体不公平(例如,在一个群体的文化中讲得通的答案被认为是不正确的)时,或者当问题以对某些学者来说由于语言或文化差异而显得陌生的方式表达时,就会出现这种情况。作为这种偏差的一个子类别,项目选择偏差是指个别测试项目更适合一个群体的语言和文化行为。
预测效度偏差(或标准相关效度偏差) - 这指的是测试预测特定学生群体未来表现的准确性。例如,如果一个测试对所有学生群体预测未来的学术和考试表现同样准确,则该测试被认为是“无偏见的”。测试偏差与测试公平问题密切相关——即,测试结果的社会影响是否会对某些学生群体产生不公平的优势或劣势?
Explore our latest online courses and learn new skills at your own pace. Enroll and become a certified expert to boost your career.
少数族裔群体的测试偏差
涉及少数民族的评估过程存在多种可能产生偏差的途径。这种偏差可能是由于文化或种族以及少数民族群体地位的差异造成的。尽管文化有许多定义,但它通常指的是一个社会的行为模式、符号、制度、价值观和人为产物。另一方面,种族可以用来描述一个种族、民族或文化群体。一个人的种族通常传达一种社会文化意义上的“民族认同感”,群体成员共享一种代代相传的社会和文化遗产。
此外,种族群体成员经常感受到与群体中其他成员的命运相互依赖。除了文化和种族之外,少数民族群体成员还会经历少数民族群体地位,这涉及到种族或种族关系的历史。这段历史影响了人际关系、前景和表现。因此,为了完全理解少数民族群体、他们的反应和评估过程,必须剖析文化、种族和少数民族群体地位。对测试和测量偏差的关注不仅仅是“政治正确”的问题,也不是少数民族因他们在各种测试和测量中的表现而感到不满而永恒化的问题。偏差确实存在于我们的许多评估工具和程序中。
当测试项目是从排他性的角度编写的,从而使其他学生群体处于不利地位时,就会发生评估偏差。当测试包含维护偏见或歧视或贬低其他群体的项目时,该项目被认为是有偏见的。例如,像“一毛不值”这样的表达就可能影响使用不同货币或英语不流利的群体。评估偏差不仅包括测试项目,还可能由于参加测试的学生群体、环境或测试设计方式而产生。
如果评估在没有考虑学生对文化传统的理解的情况下不公平地衡量学生的技能和知识,则会发生测试中的文化偏差。当评估没有考虑学生的文化差异时,它们未能直接衡量学生的才能,并可能导致基于不准确数据的结论。当注释者或测试材料没有考虑学生在一个特定文化群体中对语义和经验的缺乏了解时,就会发生测试中的文化偏差。
测试中文化偏差的影响是,来自少数民族文化背景的学生不成比例地被纳入特殊教育服务。此外,在衡量语言能力时,学生可能会被错误地贴上障碍的标签,因为测试结果表明存在语言障碍。然而,数据差异可能是由于文化差异造成的。文化测试偏差的主要特点是,测试是由一群同质的人组成的,他们不能代表参加测试的学生的文化多样性。此外,测试本身也可能由于测试项目的內容、测试的格式或进行评估的环境而存在文化偏见。
测试中文化偏差的一个影响是通过将数据不公平地表示为智力或能力的暗示来维持不公平的概念。结果,测试结果不公平地衡量有色人种学生,当错误在于有偏见的测试而不是提供学生能力的准确衡量时,他们的分数较低。结果,有色人种学生被安置在特殊教育项目中的比例过高。同样,有偏见的标准化测试加剧了对边缘化人群和良好学术成就前景的误解。
减少测试偏差的步骤
鉴于测试结果在对学生做出重要决定时仍然被广泛使用,测试开发者和专家们已经联系了几种策略,这些策略可以减少,甚至消除测试偏差和不公平。许多具有代表性的例子包括:
在测试开发人员中寻求多样性,并培训测试开发者和编写者,让他们意识到文化、语言和社会经济偏差的可能性。
让接受过识别文化偏差培训的专家以及来自不同文化和语言群体的代表审查测试材料。
确保用于开发常模化测试的常模化过程和样本量包含不同的学生群体,并且足够大以构成具有代表性的样本。
禁止产生最大种族和文化绩效差距的项目,并选择产生最小差距的项目——一种被称为“黄金法则”的方法。(然而,鉴于任何给定测试人群中可能代表的种族、民族和文化群体的数量,这种特定策略在逻辑上可能难以实现)。
搜索并禁止可能更容易冒犯某些群体的项目、参考资料和术语。
将测试改写成测试者的母语,或使用从业人员改写测试项目。
包括更多“基于表现”的项目,以限制语言和词语选择在测试表现中所起的作用。
使用多种评估方法来确定学生的学业成就和进步,避免仅依靠考试成绩来做出关于学生的重大判断。
结论
尽管智力测试作为一种量化工具具有科学和精确的特性,但它却是一种带有文化偏见的程序,导致对少数群体,特别是少数族裔学生存在歧视。在公立学校中持续使用的两种最常见的测试——学业成就测试和智力测试——都假设所有测试者都具有相同的、被测试题目所考察的行为能力。它们还假设全国的学校教育水平一致,并且所有参加测试的人都具有相同的英语语言能力。这种文化偏见还受到其他因素的影响,例如题目选择过程、题目的内容以及被认为是这些题目可接受的答案。