计算机辅助评估
计算机辅助测试的支持者认为,它使记录歌曲作者和导师的分数更容易得多。此外,经常参加这些考试的个人可以立即查看他们的分数。然而,一些批评者仍然认为,具有不同阅读和信息处理方式的人可能会发现计算机测试比较困难。
计算机辅助评估
计算机辅助测试是一种评估模型,其中考生或测试者回答计算机程序一部分的问题或完成练习。在许多情况下,计算机测试还包括自动评分。当存在有限数量的正确答案时,就会发生这种情况,例如多项选择测试模型。例如,当简答题和论文题包含在计算机辅助测试中时,评分者会阅读答案并将分数输入数据库。计算机辅助测试用于标准化测试以及课堂上的心理和技能评估,也可能被希望自我测试的个人使用。
计算机辅助评估的历史发展
计算机化测试方法长期以来一直对提供心理评估服务非常重要。自从计算机在20世纪50年代首次被引入并应用于评估心理学领域以来,它们一直是评分、数据处理和解释测试结果的宝贵工具。本文总结了基于计算机的人格和神经心理学测试的历史和现状。文章强调了计算机提供测试解释中涉及的几个实际问题。
介绍了计算机辅助测试使用的进展,例如自适应测试,并指出了存在的问题。目前,人们非常有兴趣扩展互联网上心理评估服务的可用性。虽然这些服务显示出巨大的潜力,但与在互联网上提供心理测试相关的几个问题需要心理学家在互联网成为心理服务提供的主要媒介之前予以解决。
计算机辅助评估的优势
与临床医生推断的估计相比,计算机化评估之所以能够取得最近的增长和现状,很大程度上要归功于计算机为心理评估任务提供的独特优势。
计算机具有时间和成本效益。自动化报告可以在测试完成后的短时间内提供,从而节省宝贵的专业时间。
使用计算机进行心理评估的另一个优势在于其评分的准确性,因为在评分时,计算机不太容易出现人为错误。
第三,计算机通过最大限度地减少对数据进行主观解释的可能性,提供了更客观和更不偏颇的解释。
自动化报告的第四个优势是,它们通常比临床医生的报告更全面。测试者的概况与自动化解释中的许多其他概况进行比较。因此,测试信息可以更直接地用于对受试者进行分类,同时描述具有相似概况的人的行为、行为和学习。总之,经过精心设计的测试结果和辅助信息的统计处理将比使用相同信息的个人专业人员得出更有效的结论。
最后,自动化测试管理对某些受试者来说可能更有趣,他们也可能觉得对计算机评估者的反应比纸笔测试的特殊不同环境更不焦虑。
计算机辅助评估的劣势
虽然自动化评估的优势很多,但该系统并非完全没有问题。
与自动化管理、评分和解释相关的一个主要问题是,缺乏资质的专业人员滥用。自动化评估可能会鼓励那些缺乏足够知识和经验的专业人员使用。重要的是要记住,只有在具有足够培训和经验的专业人员手中,才能保证通过自动化心理评估获得的信息的有效性。
计算机辅助评估的另一个风险是,心理健康专业人员可能会过度依赖计算机报告,从而减少他们亲自解释测试数据的积极性。此外,自动化报告不能替代重要的临床观察,这些观察提供了与正式测试结果相结合的基本信息。
第三个问题源于这样一种错误观念,即计算机生成的评估会产生不可避免的事实信息。不能认为计算机评估会产生不能质疑的精确的科学陈述。基于计算机的结论并非一成不变,对这种解释进行批判性审查对于其可靠使用是必要的。
第四,计算机报告中的计算机陈述可能会提供关于测试者对个人目的有用的模糊信息。将临床意见建立在这种类型的陈述上可能会导致不准确的建议。
最后,自动化报告可能包含不适用于所有情况的陈述。重要的是要记住,计算机报告是对概况的总体描述,而具有相似概况的个体只会保留特定概况关联的某些特征。专业人员必须确定每个客户对测试报告的具体情况。
计算机辅助心理评估的过程
计算机辅助评估和心理疗法已被证明对来自不同样本、国家和呈现问题的大学生有效。目前可用的数字技术可以解决这些心理健康服务提供方面的挑战,例如有限的人力资源、学生寻求帮助的失败、寻求帮助的学生的污名化、过早终止、低效流程和结果数据来评估和促进治疗效果,以及缺乏基于实时数据的治疗选择。
基于计算机的心理评估自40多年前开始发展以来已经取得了长足的进步。许多解释者使用计算机评分和基于计算机的解释,并将基于计算机的测试解释视为一种专业的、符合伦理的努力。自动化方法的应用在范围和深度上都得到了扩展。然而,计算机技术和心理测试解释的结合并非一种完美的关系。以往在自动化评估方面的努力需要进一步努力,以充分利用计算机的灵活性与能力来做出复杂的判断。自动化操作在某种程度上受到现有心理专业知识和心理技术的限制。
迄今为止,基于计算机的关系仅限于书面材料。它们没有考虑诸如关键语言线索(例如,言语模式、口语语调和面部表情)之类的潜在宝贵信息。研究支持了这样一种观点,即计算机管理的测试与纸笔管理的工具是不同的。因此,研究得出结论,计算机生成的报告应被视为临床判断的宝贵补充,而不是专业临床医生的替代品。尽管存在一些局限性和未实现的潜力,但基于计算机的心理评估是一项非常成功的尝试。关键词:自适应测试;基于计算机的项目管理;基于计算机的测试解释(CBTI);自动化评估;基于互联网的测试操作;明尼苏达报告;MMI-2。
计算机自适应测试
计算机自适应测试 (CAT) 针对每个人的能力水平量身定制。“自适应测试试图模仿一位知识渊博的考官的考试策略……如果一位考官提出一个对考生来说过于困难的问题,那么接下来提出的问题将大大简化,”Wainer (1990) 写道。这项考试被称为自适应测试,因为 CAT 可以根据学生的回答修改或更改测试项目的难度级别。CAT 比传统测试更有效、更集中,并且 CAT 可以收集更多数据以获得更可靠的结果,方法是利用技术。此外,它非常耗时且资源密集型。由于 CAT 具有很强的区分能力,因此更容易区分高绩效和低绩效的考生。
在 CAT 中制作测试项目需要许多学术领域的一套技能以及每个能力的多个指标。三个能力级别是 1 级、2 级和 3 级。低级别能力更容易评估,而高级别能力更难确定。此外,低级别能力包含构建式反应(开放式)项目,而高级别能力包含选择式反应(封闭式)项目。项目克隆是一种用于提高测试项目可用性和降低项目创作成本的技术。
试题克隆是指创建测试试题以评估相同的概念,但使用替换的随机组件(名称、地点等)。它允许创建试题库,从而实现经济高效的CAT(计算机自适应测试)部署。您可能同意我们的观点,即开发测试试题以及针对每个指标的试题都具有挑战性。例如,某些指标无法以文字形式进行评估,而另一些指标只能使用数学题进行测试。对于有多个正确答案的测试试题,评分需要使用评分标准。
同样重要的是要理解CAT是诊断性、形成性还是总结性。如果是诊断性目标,则需要许多具有单一操作的元素(诊断错误和解决要求)。但是,如果目标是总结性,则需要复杂的试题来评估熟练程度。关于CAT测试类型,选择题需要更多试题,而简答题则需要较少试题。
结论
研究比较了计算机辅助心理评估对被试的影响与传统的纸笔心理测量管理程序,结果表明,不同管理方式对被试自我报告的焦虑、肌电图测量的压力或任务满意度没有显著差异。此外,计算机辅助评估被设置为不同的速度效率,并且据推测,更有利于激发被试对测试细节的开放性。