效度类型

效度可能是测试质量最重要的标准。效度一词指的是测试衡量其声称评估内容的能力。高效度测试中的项目将与考试的预期重点密切相关。这意味着许多认证和许可考试将与特定工作或职业密切相关。当测试缺乏效度时，它未能评估它应该评估的与工作相关的材料和能力。在这种情况下，没有必要将测试结果用于其预期目的。

效度类型

效度有四种类型 -

内容效度
效标关联效度（进一步细分为）
- 同时效度
- 预测效度
构念效度（进一步细分为）
- 收敛效度
- 区分效度
表面效度

这些将在下面讨论 -

内容效度

McBurney 和 White（2007）将内容效度定义为测试应该对被测理论概念所代表的行为范围进行抽样的理念。这是一种非统计类型的效度，它涉及评估测试的内容以查看它是否包含被评估行为的典型样本。具有内容效度的测试中的项目表明了考试应该涵盖的所有可能的项目范围。例如，如果一位研究人员想要为三年级学生创建一项拼写成就测试，他或她可能会列出三年级学生应该知道的所有单词。

可以从大量对象中选择单个测试项目，包括各种商品。内容效度被整合到测试中。在彻底审查主题内容后，根据项目与测试标准的兼容性选择项目。在某些情况下，如果测试评估难以定义的属性，专家可以对项目的相关性进行评分。由于每个评判者对他们的评估都有自己的看法，因此考试将由两位独立的评判者分别进行评分。两位评判者都认为非常重要的项目将包含在最终考试中。

效标关联效度

效标关联效度的概念指出，有效的测试应该与同一理论概念的其他衡量标准密切相关。一个好的智力测试应该与其他智力测试有很强的相关性。如果测试显示出成功的预测标准或构念指标，则称其具有效标关联效度。效标效度有两种类型。

同时效度 - 当标准测量和测试分数同时达到时，就会发生这种情况。它表示测试结果估计个人当前标准状况的程度。例如，如果一项测试评估焦虑，如果它准确地反映了个体的当前焦虑程度，则认为它具有同时效度。同时效度证据通常适用于成就测试和临床诊断测试。
预测效度 - 当标准测量在测试后收集时，就会出现预测效度。例如，能力倾向测试可以帮助确定谁更有可能在特定主题上成功或失败。预测效度是入学考试和职业测试的重要方面。

构念效度

构念效度方法比其他类型的效度更复杂。McBurney 和 White（2007）将构念效度定义为测试的属性，其中测量真正衡量了旨在测量的构念。有许多方法可以确定测试是否产生构念有效的数据。

测试应该以相同的方式衡量正在测试的理论概念。例如，领导能力倾向测试不应真正评估外向性。
构念效度方法比其他类型的效度更复杂。McBurney 和 White（2007）将构念效度定义为测试的质量，即测量真正衡量了它应该评估的构念。
有各种方法可以确定测试是否生成具有构念效度的数据。测试应该真正评估正在测试的理论概念，而不是其他任何东西。例如，领导能力测试不应真正评估外向性。

构念效度有两种类型 -

收敛效度 - 它意味着衡量标准与理论上预测相关的另一衡量标准的相关程度。
区分效度 - 这解释了操作化与理论上不应该相关的其他操作化的相关程度。

表面效度

表面效度是指表面上似乎测量的什么。这取决于研究人员的自由裁量权。检查每个问题并进行调整，直到研究人员满意它准确地测量了预期的构念。研究人员的主观判断用于确定表面效度。

效度的方面

效度有两个不同的方面：内部和外部。

内部效度

内部效度是最基本的一种效度，因为它涉及自变量和因变量之间关系的逻辑。基于测量和研究方法，这种效度估计可以推断因果关系的程度。设计良好的实验方法，在受控良好的环境下检查自变量对因变量的影响，提供了更高程度的内部效度。

对内部效度的威胁 - 对内部效度存在多种威胁。其中一些是 -

混淆 - 当实验中两个变量的影响无法分离时，就会出现混淆错误，导致对结果的解释混乱。混淆是对实验效度最严重的威胁之一。如果实验者无法控制自变量，混淆尤其成问题。当参与者根据是否存在某种条件进行选择时，受试者变量可能会影响结果。可能会形成与原始原因和推论假设相竞争的假设，其中无法避免误导性联系。
选择偏差 - 组选择中的任何偏差都可能危及内部效度。选择偏差表示由组间测试前差异引起的问题，这些差异可能与自变量相互作用，从而影响观察到的结果并导致问题；例如，性别、个性、心理和身体能力、动机水平和参与意愿。
历史 - 实验外部或因变量重复评估之间发生的事件，例如自然灾害或政治变化，可能会影响参与者在实验过程中的反应、态度和行为。在这种情况下，很难判断因变量的变化是由于自变量还是历史事件造成的。
成熟 - 参与者在实验过程中或测量之间发生变化是很常见的。例如，在纵向研究中，幼儿可能会因其可衡量的经验、能力或态度而成熟。永久性变化（例如身体发育）和短暂性变化（例如疲劳和疾病）会影响一个人对自变量的反应方式。因此，研究人员可能难以确定变化是由于时间还是其他变量造成的。
频繁测试 - 由于重复测试，参与者可能会产生偏差。参与者可能会回忆起正确的答案或由于测试的重复交付而受到条件影响。此外，它增加了对内部效度构成威胁的可能性。仪器更换/更改：如果在实验过程中更换/更改任何仪器，它可能会影响内部效度，因为很容易获得替代解释。

外部效度

根据 McBurney 和 White（2007）的说法，外部效度关系到研究结果是否可以推广到另一个背景、新的参与者、地点、时间范围等。使用人类参与者的实验通常使用来自特定地理区域或具有独特特征的小样本，从而降低了外部效度（例如，志愿者）。因此，无法确保关于因果关系的发现与不同地理区域的人或缺乏这些特征的人相关。

对外部效度的威胁 - 外部效度的一个主要问题是如何在形成概括时可能需要进行校正。通常，当原因（即自变量）依赖于其他因素时，概括受到限制；因此，所有外部效度风险都与自变量相互作用。

能力-处理交互 - 样本可能包含与自变量相互作用的特征，从而限制了普遍性；例如，从比较心理治疗研究中得出的结论通常使用特定样本（例如，志愿者、高度抑郁、重刑犯）。
情况 - 所有情境特征，例如治疗条件、光线、噪音、地点、实验者、时间、范围和测量程度等，都可能限制概括。
测试前效应 - 当因果关系只能在测试前发现时，结果的普遍性也受到限制。
测试后效应 - 当因果关系只能在测试后完成时进行研究，这可能会进一步限制结果的普遍性。
罗森塔尔效应 - 当来自因果关系的推论不能推广到其他调查人员或研究人员时。

Explore our latest online courses and learn new skills at your own pace. Enroll and become a certified expert to boost your career.

结论

内容效度决定了一个问题、任务或测试项目在多大程度上代表了测试旨在抽样的行为总体。如果测试对测试使用者、考试人员以及最重要的是考生而言似乎有效，则该测试具有表面效度。当测试预测可接受的结果测量的表现时，它就体现了效标关联效度。当自变量和因变量之间存在因果关系时，就会产生内部效度。当实验中两个自变量的影响无法独立分析时，就会出现混淆。外部效度关注的是研究结果是否可以应用于新的情况：不同的参与者、地点、时间等等。

Utkarsh Shukla

更新于： 2023年2月9日

4K+ 浏览量

开启你的职业生涯

通过完成课程获得认证

开始学习