卡方检验在心理学中的应用
卡尔·皮尔逊于 1900 年提出了卡方 (X2) 检验,这一发展常常被认为是统计学领域最重大的创新之一。在心理学研究中,该检验及其所基于的统计分布有着广泛的应用。其两个主要应用是:评估理论模型或一组先验概率与一组数据的拟合程度,以及检验两个变量的独立性。卡方检验涉及观察频率 (O) 和预期频率 (E),而预期频率可以通过理论或经验研究来确定。
卡方检验
当检验统计量在零假设下服从卡方分布时,就会进行卡方检验。使用该检验分析的数据是多元的。例如,如果我们想了解植物 A 和植物 B 在两种不同的肥料组合下的表现,我们将使用卡方检验。
这是一种非参数方法,用于确定两个名义变量或有序变量之间是否存在统计学意义上的关系。卡方检验只能报告样本中各组在某些测量的属性或行为上是否存在显著差异;它不允许从样本推断到其来源的总体,因为它分析的数据比参数检验(如 t 检验和方差分析 (ANOVA))更粗略。然而,由于卡方检验对数据的要求“较低”,因此它可以应用于各种研究情境。
步骤
数据被分类成互斥的类别。如果不存在差异的零假设为真,则观察结果将遵循卡方分布。该检验评估如果零假设为真,观察到的值的可能性有多大。
如果观察结果是独立的,则观察结果将遵循卡方分布,并且当样本量增加时,分布将更接近卡方分布。
卡方分布是连续的,但卡方检验用于离散值。因此,为了解释小样本量数据中的误差,卡方检验应用了 Yates 校正,尽管近年来对其必要性提出了质疑。
零假设下的卡方检验
假设我们从某个实验中获得了一组观察频率,并希望了解这些数据是否支持某个特定的假设或理论。卡尔·皮尔逊在 1990 年创建了一个检验,以评估实验值与根据某些理论或假设获得的理论值之间差异的重要性。这个检验称为 2 检验,用于确定观察值(实验)与理论值或假设值之间的差异是否可以归因于偶然性(抽样波动),或者是由理论无法匹配观察数据造成的。零假设指出观察值(实验)与理论值或假设值之间没有显著差异,这意味着理论与实验是一致的。
卡方检验的要求
卡方检验是一种统计显著性检验,它将样本中测量的两个变量的观察频率与在两个变量之间不存在关系的情况下预期的频率进行对比。换句话说,卡方检验确定实际结果与零假设的差异是否足够大,以至于超过了它们可能是随机机会、抽样误差或两者兼而有之的结果的可能性。
卡方检验依赖于一个较弱的假设,即每个变量的值在其样本所来自的总体中呈正态分布。然而,与 t 检验等参数检验不同,它不要求样本数据处于区间测量水平或大致呈正态分布。但是,卡方检验也有一些前提条件。
在检验名义变量和有序变量之间的关系时,卡方检验是最佳工具。名义变量(如性别)根据互斥的、不相关的类别来描述属性。有序变量测量的是主体可能或多或少具有的特征,但不能在尺度上以相等的步长进行测量(例如,军衔)。
样本必须从总体中随机抽取。
必须使用原始频率来报告数据,而不是例如百分比。
被测量的变量必须彼此无关。每个变量对于每个观察结果只能有一个类别或值,并且任何类别都不能本质上依赖于或受任何其他类别影响。
独立变量和因变量上的值和类别必须是穷举的和互斥的。在鞋类统计中,每个受试者只计算一次,具体取决于他们是否喜欢凉鞋、运动鞋、皮鞋、靴子或其他类型的鞋类,以及他们是否被认定为男性或女性。某些变量可能不需要“其他”类别,但“其他”通常确保变量已得到完全分类。(某些分析可能需要“无法确定”类别。)无论如何,必须包含整个样本的结果。
独立性卡方检验
请记住,定性数据是指您收集有关人员的信息,这些信息被组织成类别或名称。然后,您将统计有多少人拥有某些特征。例如,有一种假设认为母乳喂养与自闭症之间存在关联。为了检验是否存在关联,研究人员可能会收集有关女性母乳喂养孩子的时间长短以及该孩子是否被诊断出自闭症的数据。然后,这些信息将存储在表格中。您将想知道每个单元格是否独立于其他单元格。请记住,独立性是指一个事件不会影响另一个事件。这意味着患有自闭症与母乳喂养无关。您想知道的是它们是否独立。换句话说,一个如何影响另一个?如果您要进行假设检验,这将是您的备择假设,而零假设则是它们是独立的。独立性卡方检验就是针对这种情况的假设检验。
拟合优度卡方检验
您使用实验方法和理论方法来估计概率中的概率。通常需要确定实验值与理论值之间的匹配程度。例如,假设您想查看骰子是否公平。为了查看观察值是否与预期值匹配,请检查观察值与预期值之间的差异是否足够大,以至于可以得出结论:如果观察值与预期值匹配,则检验统计量不太可能发生。在这种情况下,检验统计量也是卡方。该步骤与独立性卡方检验相同。
结论
预期(和观察到的)频率必须合理。卡方检验基于一个假设,即任何类别内的样本频率在预测的总体值周围呈正态分布。当预期的总体值接近于零时,分布不可能是正态的,因为出现的频率不能为负。当预期频率较大时,正态分布的假设是有效的,但随着预期频率的减少,卡方检验结果的有效性也会降低。表格中的任何单元格都不能观察到原始频率为零,因为某些卡方数学公式需要除法。