心理学中P值技术的应用


理解p值的一种方法是考虑在零假设为真的总体中发现随机样本中观察到的差异或更极端差异的可能性。由于假设检验非常普遍,因此几乎所有定量研究论文都包含p值。在详细介绍之前,让我们简要讨论一下假设检验。

假设检验

研究假设是基于理论或先前研究逻辑对研究结果的预测。最好的理论是明确而具体的,允许它们在没有任何疑问的情况下被证明或证伪。因变量是用来检验假设的标准。提出可检验的假设有助于澄清关于特定研究问题的疑问。它迫使研究人员概述评估假设所需的确切信息以及执行此操作的方法。

传统上,在使用统计技术检验假设时,假设因变量的任何变化都是偶然造成的。这些过程确定看似存在的差异并非真实的可能性。因此,为了进行统计检验,假设必须以零假设的形式陈述(即,预测没有差异)。当统计分析显示因变量之间没有差异的可能性很大时,接受零假设。当没有实际差异的可能性很低时,零假设被推翻。

当研究假设得到证实时,这表明数据变化不能用巧合来解释。此外,它表明假设提出的因果变量可能解释了这些变化,但只要存在替代假设,它们并不一定会这样做。因此,发展理论包括淘汰薄弱的假设,直到留下一个在反证尝试下仍然成立的假设,而不是证明一个假设。

错误类型

在决定是否接受或拒绝统计假设时,可能会发生两种类型的错误:I型错误和II型错误。I型或α错误是在因变量保持不变时拒绝零假设。II型或β错误发生在因变量发生变化时接受零假设。

显著性水平

假设检验中I型错误的概率由选择的显著性水平决定,通常用α(或P临界值α)表示,这是一个在数据收集之前选择的概率值,范围从0到1。最常见的α值为.05和.01,但研究人员也可能使用其他α值,因为他们会考虑I型和II型错误的后果。当α为.05时,在零假设为真时拒绝零假设的概率为5%,这被称为I型错误。因此,α为.01意味着I型错误发生的概率为1%。α是拒绝H0的标准。

p值

在设定α值之后,研究人员会从他们将从中得出结论的总体中随机选择的样本中收集数据。务必记住,H0是在数据收集之前设定的。使用来自此样本的信息计算感兴趣的统计量。在H0为真的总体中,样本统计量与假设总体参数之间观察到的差异的可能性用于做出关于接受或拒绝H0的决定。

下一步是计算在H0为真的总体中从随机样本中获得观察到的或更极端差异的可能性。这种可能性被称为p值或P计算值。如果p值小于α水平,则拒绝H0,当拒绝H0时,这被称为统计显著的结果。如果p值大于α水平,则H0不被推翻,这种选择被称为统计不显著的结果。p值是使用抽样分布计算的,范围从0到1,就像α和其他所有概率一样。

历史背景

p值首先由卡尔·皮尔逊在他的皮尔逊卡方检验中正式提出,使用卡方分布并记作大写P。卡方分布的p值(对于不同的χ2值和自由度),现在记作P,在(Elderton 1902)中计算,并被收集。罗纳德·费希尔普及了p值在统计学中的应用,它在费希尔的统计方法中起着核心作用。

示例

假设一位研究人员掷一对骰子一次,并假设骰子是公平的。检验统计量是单尾的,是“掷出的数字的总和”。研究人员掷骰子,注意到两个骰子的值都是6,导致检验统计量为12。这个结果的p值为1/36,大约为0.028(36个可能结果中最高的检验统计量)。如果研究人员使用0.05的显著性阈值,则此结果将被认为是显著的,并且骰子是公平的假设将被拒绝。在这种情况下,单次掷骰为得出关于骰子的重要结论提供了非常薄弱的基础(证据不足)。这说明了在不考虑实验设计的情况下应用p值的风险。

结论

由于在应用环境中假设检验的目的可能很复杂,因此定量结果经常需要解释。对假设检验的部分理解可能会导致系统性问题,从而影响研究报告的质量。理解假设检验和p值并谨慎使用它们对于高质量的研究报告至关重要。

更新于:2022年12月30日

浏览量:132

开启您的职业生涯

完成课程获得认证

开始学习
广告
© . All rights reserved.