- Python 数据科学教程
- Python 数据科学 - 首页
- Python 数据科学 - 入门
- Python 数据科学 - 环境搭建
- Python 数据科学 - Pandas
- Python 数据科学 - NumPy
- Python 数据科学 - SciPy
- Python 数据科学 - Matplotlib
- Python 数据处理
- Python 数据操作
- Python 数据清洗
- Python 处理 CSV 数据
- Python 处理 JSON 数据
- Python 处理 XLS 数据
- Python 关系型数据库
- Python NoSQL 数据库
- Python 日期和时间
- Python 数据整理
- Python 数据聚合
- Python 读取 HTML 页面
- Python 处理非结构化数据
- Python 词法分析
- Python 词干提取和词形还原
- Python 数据可视化
- Python 图表属性
- Python 图表样式
- Python 箱线图
- Python 热力图
- Python 散点图
- Python 气泡图
- Python 3D 图表
- Python 时间序列
- Python 地理数据
- Python 图数据
Python - P值
P值关乎假设的强度。我们基于某些统计模型建立假设,并使用P值比较模型的有效性。一种获得P值的方法是使用T检验。
这是一个针对零假设的双侧检验,该零假设认为一组独立观测值“a”的期望值(均值)等于给定的总体均值popmean。让我们考虑以下示例。
from scipy import stats rvs = stats.norm.rvs(loc = 5, scale = 10, size = (50,2)) print stats.ttest_1samp(rvs,5.0)
上述程序将生成以下输出。
Ttest_1sampResult(statistic = array([-1.40184894, 2.70158009]), pvalue = array([ 0.16726344, 0.00945234]))
比较两个样本
在以下示例中,有两个样本,它们可能来自相同的分布或不同的分布,我们想要检验这些样本是否具有相同的统计特性。
ttest_ind - 计算两个独立样本得分的均值的T检验。这是一个针对零假设的双侧检验,该零假设认为两个独立样本具有相同的平均值(期望值)。默认情况下,此检验假设总体具有相同的方差。
如果我们观察到来自相同或不同总体的两个独立样本,可以使用此检验。让我们考虑以下示例。
from scipy import stats rvs1 = stats.norm.rvs(loc = 5,scale = 10,size = 500) rvs2 = stats.norm.rvs(loc = 5,scale = 10,size = 500) print stats.ttest_ind(rvs1,rvs2)
上述程序将生成以下输出。
Ttest_indResult(statistic = -0.67406312233650278, pvalue = 0.50042727502272966)
您可以使用相同长度但均值不同的新数组进行相同的测试。在loc中使用不同的值并进行相同的测试。
广告