配对样本t检验
介绍
在统计学中,配对样本t检验是一种用于比较两组样本之间数据的工具,它确定给定测量值之间的平均差异是否为零。在统计学中,双样本t检验是用于比较两个数据集均值的工具。这些检验也称为学生t检验,检验结果用于评估两个样本均值之间的差异。这种差异不太可能是由于抽样误差或偶然性造成的。配对样本t检验用于比较两个数据集的均值,其中我们获得两个样本,并进行比较以确定差异是否为零。
定义
当每个样本都由一对测量值进行评估时,使用配对样本t检验,其中配对样本t检验确定这些样本的平均变化是否为零。配对样本t检验用作一种统计程序,使用观察结果来得出数据集之间的结论。
例如
当对同一受试者进行了两次观察(例如,特定观察结果的某人的诊断测试结果)。
某类测量的两组观察结果,其中两组观察结果都属于同一受试者。(例如,使用身高、体重和年龄的体重指数)。
公式
使用配对样本t检验的公式时,遵循两个假设,即零假设和备择假设。
在零假设中,假设配对样本的均值之差为零。另一方面,在备择假设中,假设配对样本之间的差异不为零。根据结果的高低值,备择假设还有进一步的扩展。
上述假设可以表示为:
零假设,H0:d1 = d2 或 H0:d1 - d2 = 0。
备择假设,H1:d1≠d2 或 H1:d1 - d2 ≠ 0。
这里:
d1 是样本1的均值
d2 是总体中样本2的均值
计算配对样本t检验的公式:
$$\mathrm{t = \frac{m}{\frac{s}{√n}}}$$
其中,m 是均值,s 表示均值差 (d) 的标准差,n 表示“d”的大小。
表格
下表是配对样本t检验表,允许将t检验中的t值解释为陈述形式。下表给出:
双尾显著性 | ||||||
---|---|---|---|---|---|---|
自由度 (n-1) | $$\mathrm{\alpha=0.20}$$ | 0.1 | 0.05 | 0.02 | 0.01 | 0.002 |
1 | 3.078 | 6.314 | 12.706 | 31.821 | 63.657 | 318.3 |
2 | 1.886 | 2.92 | 4.303 | 6.965 | 9.925 | 22.327 |
3 | 1.638 | 2.353 | 3.182 | 4.541 | 5.841 | 10.214 |
4 | 1.533 | 2.132 | 2.776 | 3.747 | 4.604 | 7.173 |
5 | 1.476 | 2.015 | 2.571 | 3.305 | 4.032 | 5.893 |
6 | 1.44 | 1.943 | 2.447 | 3.143 | 3.707 | 5.208 |
7 | 1.415 | 1.895 | 2.365 | 2.998 | 3.499 | 4.785 |
8 | 1.397 | 1.86 | 2.306 | 2.896 | 3.355 | 4.501 |
9 | 1.383 | 1.833 | 2.262 | 2.821 | 3.25 | 4.297 |
10 | 1.372 | 1.812 | 2.228 | 2.764 | 3.169 | 4.144 |
11 | 1.363 | 1.796 | 2.201 | 2.718 | 3.106 | 4.025 |
12 | 1.356 | 1.782 | 2.179 | 2.681 | 3.055 | 3.93 |
13 | 1.35 | 1.771 | 2.16 | 2.65 | 3.012 | 3.852 |
14 | 1.345 | 1.761 | 2.145 | 2.624 | 2.977 | 3.787 |
15 | 1.341 | 1.753 | 2.131 | 2.602 | 2.947 | 3.733 |
也称为依赖样本t检验,这告诉我们两个观察结果是配对的或依赖的,因为它们包含相同受试者的数据。
配对t检验与非配对t检验
配对t检验和非配对t检验有一些区别,可以列为:
配对t检验 | 非配对t检验 |
---|---|
用于比较同一组或项目在两种相似情况下的平均差异。 | 当比较两组独立样本之间的平均差异时,使用非配对t检验。 |
在非配对t检验中,假设两个数据集之间的方差相等。 | 在配对t检验中,不假设两个数据集之间的方差相等。 |
使用两个因变量。 | 使用一个因变量和一个自变量。 |
如何进行配对样本t检验
让我们假设对n名学生进行了一次模块学习前的诊断测试,然后在完成模块学习后第二次进行相同的诊断测试。现在我们想了解学生在该模块方面的能力(如知识和技能)的具体改进。我们学生群体中的结果可用于比较该模块的效果。
让我们假设模块1和模块2的结果数据集为A和B,其中$\mathrm{x_i \in A, y_i \in B}$。其中i = 1, 2,……., n。以下是应用配对样本t检验的步骤:
根据零假设,我们假设实际均值差为零。
计算两组观察值之间的差异 (di = yi- xi)。
确定均值差,$\mathrm{\underline{d}}$。
评估标准差 (SD),然后确定标准误差,$\mathrm{SE(\underline{d}) =SD/\sqrt{n}}$。
t统计量值由$\mathrm{T=\underline{d}\: SE(\underline{d})}$确定。考虑到零假设,自由度取为“n − 1”。
参考t分布表,并将T与tn-1分布进行比较,我们得到配对样本t检验的p值。
已解决示例
让我们假设学生在两次不同测试中的分数如下所示。
学生 | 测试1分数 | 测试2分数 | 差异 |
---|---|---|---|
A | 63 | 69 | 6 |
B | 65 | 65 | 0 |
C | 56 | 62 | 6 |
D | 100 | 91 | -9 |
E | 88 | 78 | -10 |
F | 83 | 87 | 4 |
G | 77 | 79 | 2 |
H | 92 | 88 | -4 |
I | 90 | 85 | -5 |
J | 84 | 92 | 8 |
K | 68 | 69 | 1 |
L | 74 | 81 | 7 |
M | 87 | 84 | -3 |
N | 64 | 75 | 11 |
O | 71 | 84 | 13 |
P | 88 | 82 | -6 |
假设
设H0为分数之间的均值差,假设为零。
设H1为分数之间的均值差,不认为是零。
均值差;$\mathrm{\overline{d}=1.31}$
标准误差 − $\mathrm{(\overline{d}) =SD/\sqrt{n}=1.75}$
假设我们的显著性水平为α = 0.05。
现在我们计算检验统计量 t= $\mathrm{(\overline{d})/SE=1.31/1.75=0.750}$
自由度 df=n-1=15。
参考上表,α = 0.05 和 15 个自由度的 t 值为 2.131。
通过将 t 统计量值与 t 值进行比较,我们观察到 0.750 小于 2.131。因此,我们可以同意我们的假设,即均值差为零。两次考试似乎同样困难。
结论
在统计学中,双样本t检验是用于分析两个总体均值的工具。这些检验也称为学生t检验。检验结果用于评估两个数据集均值之间的差异。
例如,对同一受试者进行了两次观察(例如,特定观察结果的某人的诊断测试结果)。使用配对样本t检验的公式时,遵循两个假设,即零假设和备择假设。配对样本t检验可用于比较同一数据集或总体在两种情况下的均值。另一方面,非配对t检验比较两个独立数据集的均值。
常见问题
1. 配对样本t检验是否优于非配对样本t检验?为什么?
人们认为配对样本t检验比非配对样本t检验更准确,因为在配对样本t检验中,相同的因变量消除了样本之间的显著偏差,而非配对样本t检验则不然。
2. 在配对样本t检验中,组间的偏差可以相等吗?
不可以,在配对样本t检验中,组间的偏差不相等。
3. 在非配对样本t检验中,组间的偏差可以相等吗?
可以,在非配对样本t检验中,组间的偏差相等。
4. 如果非配对样本t检验中组间的偏差不相等,该怎么办?
对于非配对样本t检验,如果偏差不匹配,则进行 Welch 检验。
5. 零假设和备择假设之间有什么区别?
对于零假设,总体的均值差等于零;而在备择假设中,总体的均值差不等于零。