方差和标准差在心理学中的应用
变量的变异性是指其分数偏离集中趋势值(例如样本的众数、均值和中位数)的趋势。标准差和方差是直接根据变量的原始分数计算出来的,并且以与这些分数相同的单位表示。
变异性的度量
统计学中的变异性表示一组或一系列分数与其平均分数的差异。它指的是组内分数围绕均值的离散程度。有时也称为离散度。例如,在一组十名参与者中,每个人在数学考试中获得的分数都与其他人不同。可以使用变异性度量来评估这些波动,该度量计算平均值或平均分数的不同值的离散程度。组内值的离散程度有时也称为变异性或离散度。分布中的高变异性表明分数分散且不均匀。在统计学中,变异性指的是一组或一系列分数与其平均分数的差异。它实际上指的是该组分数围绕均值的分布。它也称为离散度。例如,在一组十名参与者中,每个人在数学考试中获得的分数都与其他人不同。可以使用变异性度量来评估这些波动,该度量衡量平均值或平均分数的不同值的离散程度。变异性或离散度也指组内值的离散程度。分布中的高变异性表明分数分散且不均匀。
方差
R.A. Fisher 在 1913 年使用“方差”一词来表示标准差的平方。方差的概念在高级工作中至关重要,因为这时可以将总数分成许多部分,每一部分都归因于导致其原始序列差异的原因之一。方差衡量一组数据点围绕其平均值的离散程度。它是均值的平均平方偏差的数学期望值。方差 (s2) 或均方 (MS) 是各个分数与其平均值的平方偏差的算术平均值。换句话说,它是分数的平方偏差的平均值。
方差及其密切相关的标准差是衡量分布分数离散程度的指标,换句话说,它们是变异性度量。方差计算为每个整数与均值的平方偏差的平均值。许多统计应用和分析都需要计算方差。它是一个很好的变异性绝对度量,可用于方差分析 (ANOVA) 以确定样本平均值差异的显著性。
方差的计算
对于未分组的分数,样本方差通常计算如下:
$\mathrm{s^2={\frac{\sum(X-\bar{X})^2}{n-1}}}$
其中,$\mathrm{\sum(X-\overline{X})^2}$ = 分数与其样本均值的平方差之和,也称为平方和
n = 频数的总数
或者,
$\mathrm{s^2={\frac{n\sum x^{2}-(\sum x)^2}{n(n-1)}}}$
其中,$\mathrm{\sum X^2}$ = 分数的平方和
n = 频数的总数
对于分组为规则组距的频数分布,方差按以下公式计算为标准差的平方:
$\mathrm{s^2=\frac{\sum f(x_c-\overline{x})^2}{n-1}}$
其中,f = 组距的频数
Xc = 组距的中点
参数方差或总体方差用符号 $\sigma^2$ 表示。
示例
计算以下家蝇翅长 (mm) 的方差和标准差:
3.5, 4.8, 4.3, 3.4, 5.1, 4.2, 3.8, 4.5, 3.6, 5.0, 3.4, 4.4, 5.3, 3.7, 4.0, 3.3
解答
在表 4.9 中输入分数 (X) 后,对每个 X 分数进行平方,并将平方分数 (X2) 也输入表中。对 X 和 X2 分数求和得到 $\mathrm{\sum X}$ 和 $\mathrm{\sum X^2}$,分别用于计算方差 (s2) 和无偏标准差。
序号 | 翅长 (X) | X2 | 序号 | 翅长 (X) | X2 |
---|---|---|---|---|---|
1 | 3.5 | 12.25 | 累计 | 37.2 | 156.64 |
2 | 4.8 | 23.04 | 10 | 5.0 | 25.00 |
3 | 4.3 | 18.49 | 11 | 3.4 | 11.56 |
4 | 3.4 | 11.56 | 12 | 4.4 | 19.36 |
5 | 5.1 | 26.01 | 13 | 5.3 | 28.09 |
6 | 4.2 | 17.64 | 14 | 3.7 | 13.69 |
7 | 3.8 | 14.44 | 15 | 4.0 | 16.00 |
8 | 4.5 | 20.25 | 16 | 3.3 | 10.89 |
9 | 3.6 | 12.96 | 9 | 66.3 | 281.23 |
结转 | 37.2 | 156.64 | 合计 | ($\mathrm{\sum X}$) | ($\mathrm{\sum X^2}$) |
$\mathrm{s^2=\frac{n \sum x^2 − (\sum x)^2}{n(n-1)}}$
$\frac{(16 \times 281.23 − 66.32)}{16(16 − 1)}$
$\mathrm{= 0.433mm^2}$
$\mathrm{s = \sqrt{s^2} = \sqrt{0.433} = 0.658 \: mm}$
方差分析 (ANOVA)
实验旨在研究一个或多个自变量对一个或多个因变量的影响。ANOVA 用于确定样本暴露于自变量是否显着增加了因变量的方差,超过了可归因于随机原因的变异。主要目标是计算三个或多个分数组的均值由于抽样误差而不同的可能性。
ANOVA 的类型
主要类型是:
标准差 (SD)
卡尔·皮尔逊于 1893 年提出标准差,用 s 或 $\sigma$ 表示,以衡量离散度。它被定义为偏离算术平均值的平方值的算术平均值的正平方根。卡尔·皮尔逊在 1894 年的著作中首次使用了“标准差”一词。总体标准差用“(希腊字母 sigma)”表示,样本标准差用“$\sigma$”表示。SD 很实用,因为它与数据一样,以相同的单位表示。这是最常用的变异方法。标准差表示所有分数围绕均值的平均值。它是所有分数与其均值的平方偏差的均值的正平方根。它是正方差的平方根。
标准差表示与均值的方差,而 SD 仅根据均值确定。低标准差表示数据接近均值,高标准差表示数据分布在较宽的值范围内。标准差可用于评估不确定性。如果您想检验理论或评估测量结果是否与理论预测一致,则标准差可以提供信息。如果均值和标准差的差异特别大,则应更新正在检验的理论。
标准差最低的均值比标准差最高的均值更可靠,较低的 SD 表示数据更均匀。为数据收集中的每个观测值计算标准差值。SD 用于后续的统计分析,因为它是在代数上处理的唯一离散度量。
标准差用于以下情况:
需要寻求最稳定的统计量,我们需要最可靠和最准确的变异性度量。
极端偏差应对方差产生成比例更大的影响,以及当分布为正态分布或接近正态分布时。
计算
$\mathrm{s=\sqrt{\frac{\overline{\sum(X-\overline{X})^2}}{n}}={\sqrt{\frac{\sum X^2}{n}}}}$
其中,X = 各个分数
$\mathrm{\overline{X}}$ = 样本均值
$\mathrm{(X − \overline{X})}$ 或 x = 分数与 $\mathrm{\overline{X}}$ 的偏差
优点
它有严格的定义,并基于分布的所有观测值。
与其他变异性度量相比,它是总体参数更稳定或更准确的估计值。
在所有离散度量中,SD 受抽样波动影响最小。
可以确定两个或多个组的组合 SD。
它在进一步的统计工作中得到广泛应用。例如:计算偏度和峰度、相关性和回归,以及显著性检验
标准差是抽样中的基石,并为正态偏差提供了一个测量单位。
结论
方差或标准差等度量不能用于比较以不同单位表示的多个变量的分数的离散度或变异性。此外,这些绝对度量不适用于比较以相同单位表示但具有很大差异和中心值的两个分数集的变异性。