心理学测验题目的编写


心理学测验题目在评估个体的智力、情绪和人格方面至关重要。它们被用于各种情境,例如教育评估、临床评估和研究。测验题目能够对个体进行客观测量,并有助于识别群体内部的模式和趋势,以及根据不同特征比较群体。它们还有助于确定干预措施或治疗的有效性。然而,为了确保测验题目的效度和信度,必须考虑题型、作答选项和评分方法。

题型

您在课堂上最可能遇到的考试类型是,对于每个测验题目,您都会因为提供特定答案或选择一个“正确”选项而获得分数。这种方法用于是非题和选择题考试。类似的格式用于各种其他目的,包括评估态度、测试对交通规则的理解,以及识别某人是否具有与特定健康状况相关的特征。这种类型最基本的测验具有二分法题型。

二分法题型

二分法题型为每个题目提供两个选项,通常选择其中一个选项即可获得分数。是非题是最典型的例子。这种测验要求学生回答一系列陈述,学生的任务是确定哪些命题是正确的,哪些是不正确的。是非题有很多优点,包括编制和评分简单。然而,它也越来越受欢迎,因为教师可以通过从教科书中复制句子来快速构建测验。逐字复制的句子被标记为“正确”。其他陈述则被修改,使其不再成立。

是非题有几个优点,包括其明显的简单性、管理的便利性和快速评分。另一个吸引人的方面是非题需要绝对判断,并且考试者必须选择两个选项之一。但是,也有一些缺点。

例如,是非题会促使学生死记硬背内容,让他们在包含他们不完全理解的主题的考试中获得高分。此外,“真理”通常存在灰色地带,而是非题不允许考试者展示他们对这种复杂性的理解。此外,获得任何题目正确答案的可能性是 50%。因此,为了保证信度,是非题必须包含大量题目。总的来说,二分法题目的信度和准确性低于其他题型。

在教育评估中,二分法题型不仅以是非题的形式出现。许多人格测试需要是非题或其他两选项的回答,例如是/否。

人格测试创建者经常偏爱这种风格,因为它需要完全的判断。例如,人们在回答“我经常担心我的性能力”这样的问题时不能模棱两可;他们必须回答“正确”或“错误”。对于具有多个分量表的人格测试,二分法题型提供了显著的优势。一个优点是它们使分量表的评分变得简单。测试人员只需统计一个人认可的每个分量表中有多少题目即可。

多项选择题型

多项选择题型与二分法题型类似,区别在于每个题目包含两个以上的选项。通常,选择其中一个选项即可获得分数,选择其他任何选项均不得分。选择题是您最常看到的题型,因为它是在大型课程中评估学习成就的常用方法。

选择题评分简单,并且通过偶然机会获得正确答案的可能性低于是非题。由于考试者无需书写,因此这种格式具有显著的优势,因为它需要最少的时间才能对特定题目做出反应。因此,考试可以在很短的时间内涵盖大量信息。

首先,考试应该包含多少个干扰项?根据心理测量理论,引入更多干扰项应该会提高题目的信度。然而,在现实中,增加干扰项可能不会提高信度,因为好的干扰项很难找到。没有人会选择的干扰项不会提高题目的信度。根据研究,很少能找到包含三个或四个以上有效干扰项的题目。

无效的干扰项会降低测验的信度,因为它们需要时间阅读,并且限制了可以在测验中包含的优质题目的数量。根据对选择干扰项相关问题的评估,通常建议为每个题目设置三个或四个合适的干扰项。精心挑选的干扰项是优质题目的关键组成部分。

心理测量分析有时可以为更简单的考试铺平道路。例如,大多数选择题考试都建议四个或五个答案。然而,这种惯用方法可能不是资源的最佳利用方式。在一项针对初级警官入学考试的评估中,应聘者完成了包含五个备选项的选择题或三个备选项的选择题的测试电池。

心理测量研究表明,两种类型的考试的效度和信度大致相似。这一发现意味着,在心理测量价值方面,三个备选项的选择题可能优于五个备选项,同时准备和管理时间更短。对 80 多年心理测量研究的审查证实,包含三个选项的题目与包含三个以上选项的题目一样好,甚至更好。

李克特量表题型

态度和人格测量的一种常见结构是要求受访者表达他们对特定态度问题的同意程度。这种方法被称为李克特量表题型,因为它被用作李克特(1932 年)创建态度量表方法的一部分。李克特量表上的题目包括诸如“我害怕高处”之类的短语。除了是/否回答外,还提供了五个选项:强烈不同意、不同意、中立、同意和强烈同意。

在某些应用中使用六个备选项是为了避免让回答保持中立。可能的回答包括强烈不同意、中等不同意、轻微不同意、轻微同意、中等同意和强烈同意。在对回答进行汇总之前,必须对任何措辞负面的题目进行反向评分。这种方法在测量态度方面尤其受欢迎。例如,它使学者能够确定人们对诸如“政府不应控制私营企业”之类的陈述的同意程度。

由于李克特量表题型的回答可以提交给因子分析,因此测试开发人员可以识别出一组相关的题目。李克特量表通常使用李克特量表题型创建。这些量表需要检查题目的区分度,我们将在本章后面讨论这一点。开发李克特量表有几种技术方法。

根据一些研究,强制选择题型的效度优于传统的李克特量表题型。对于测量复杂的应对反应,一些研究表明,李克特量表题型优于视觉模拟量表等方法。其他人则质疑使用典型参数统计来评估李克特量表题型的回答,因为数据是有序数据而不是区间数据。尽管如此,李克特量表题型广为人知且易于使用,并且它很可能在人格和态度测试中继续流行。

分类题型

分类题型是一种类似于李克特量表题型的策略,但具有更多选项。大多数人都知道 10 分制评分系统,因为我们经常被问到诸如“在 1 到 10 的范围内,1 表示最不漂亮,10 表示最漂亮,您如何评价您新伴侣的吸引力?”医生经常要求他们的病人评估他们的疼痛程度,范围从 1 到 10,1 表示没有疼痛,10 表示无法忍受。分类量表不必正好有 10 个点;它可以有更多或更少的类别。

实验表明,如果量表的端点定义明确,并且受试者始终了解端点定义,则可以避免此问题。例如,测试人员可以向教练展示一些视频,这些视频展示了被评为 10 分的篮球运动员的表现,以及其他一些视频,展示了 1 分意味着什么,而不是要求教练在 10 分制上给篮球运动员评分。在这种情况下,受访者不太可能以受群体中其他刺激影响的方式做出反应。

清单和 Q 分类

形容词清单是人格评估中的一种常见格式。一个人会收到一份很长的形容词列表,并被要求指出每个形容词是否描述了他或她自己。形容词清单可以用来描述自己或其他人。例如,在加州大学伯克利分校的一项研究中,评分者验证了他们认为区分了 40 名研究生群体的特征。

其中一半的学生被他们的教授评为创造力非凡,而另一半则被评为创造力低下。结果表明,用于描述这两组成员的形容词有所不同。用于描述高创造力学生的形容词最常见的是:冒险、专注、感兴趣、冷静、有创意和公平。另一方面,低创造力的学生被认为是困惑的、传统的、防御性的、有礼貌的、有偏见的和易受暗示的。

形容词清单迫使人们批准或拒绝这些形容词,导致每个项目只有两个选项。Q 分类法是一种相关的方法,它增加了类别的数量。Q 分类法可以用来描述你自己或评价他人。使用这种方法,受试者会得到一些陈述,并被指示将其排列成九堆。

结论

根据以上发现,心理学家使用测试项目来评估人们的心理能力、情绪和性格。它们被应用于各种环境中,包括研究、临床评估和教育评估。测试项目使客观地衡量人们成为可能,并有助于观察群体内部的模式和趋势,以及基于各种特征进行对比分组。它们还有助于确定干预措施或治疗的有效性。

然而,必须考虑测试项目的格式、反应选择和评分程序,以确保其有效性和可靠性。心理评估是评估心理表现的许多方面的宝贵方法,例如认知能力、人格特质和情绪状态。它们被应用于各种环境中,例如研究、临床评估和教育测试。

更新于: 2023年2月13日

818 次浏览

开启你的职业生涯

通过完成课程获得认证

开始
广告