如何在 Python 中根据 t 分数查找 P 值?
数据是一种宝贵的资产,在当今社会发挥着至关重要的作用,因为一切都强烈依赖于数据。如今,所有技术都是数据驱动的,并且定期生成海量数据。数据是未经处理的信息,数据科学家学习如何利用这些信息。数据科学家是一种专业人士,他们分析数据源,清理和处理数据,以便了解数据是如何以及为何创建的,以便提供见解来支持业务决策,从而为公司带来利润。为了检测数据中的模式和趋势,数据科学家使用统计公式和计算机算法的组合。在这篇文章中,我们将仔细研究 P 值和 t 分数,以及如何在 Python 中根据 t 分数查找 P 值。
什么是 P 值?
在统计学中,p 值是在原假设成立的情况下,产生至少与观察到的统计检验结果一样极端的结果的概率。p 值用于代替拒绝点来表示拒绝原假设的最小显著性水平。p 值越低,表示更有证据支持备择假设。
什么是 t 分数?
t 分数,也称为 t 值,是指与 t 分布均值相差多少个标准差。t 分数是 t 检验和回归分析中使用的检验统计量。当数据服从 t 分布时,它也可以用来表示观察值距离均值的距离。
在 Python 中根据 t 分数计算 P 值
Python 中的 scipy.stats.t.sf() 函数具有以下语法,它可以用来获取与给定 t 分数相对应的 p 值 -
scipy.stats.t.sf(abs(x), df)
其中 -
- x - t 分数
- df - 自由度
1. 左尾检验
假设我们希望获取一个左尾假设检验的 p 值,其中 t 分数为 -
0.77 且 df = 15。
示例
!pip3 install scipy import scipy.stats #find p-value scipy.stats.t.sf(abs(-.77), df=15)
输出
0.2266283049085413
使用 0.2266 的 p 值。由于此 p 值不小于 0.05,因此如果我们应用 = 0.05 的显著性阈值,我们将无法拒绝假设检验的原假设。
2. 右尾检验
假设我们希望获取一个右尾假设检验的 p 值,其中 t 分数为 1.87 且 df = 24。
示例
import scipy.stats #find p-value scipy.stats.t.sf(abs(1.87), df=24)
输出
0.036865328383323424
p 值为 0.0368。由于此 p 值小于 0.05,因此如果我们应用 = 0.05 的显著性阈值,我们将拒绝假设检验的原假设。
3. 双尾检验
假设我们希望获取一个双尾假设检验的 p 值,其中 t 分数为 1.24 且 df = 22。
示例
import scipy.stats #find p-value for two-tailed test scipy.stats.t.sf(abs(1.24), df=22)*2
输出
0.22803901531680093
p 值为 0.2280。由于此 p 值不小于 0.05,因此如果我们应用 = 0.05 的显著性阈值,我们将无法拒绝假设检验的原假设。
结论
这里讨论了 P 值和 t 分数。这两者都用于统计学中,从数据中获取见解并帮助更准确地预测。此外,我们可以使用 Python 从 t 分数计算 P 值。