- Python 数据科学教程
- Python 数据科学 - 主页
- Python 数据科学 - 入门
- Python 数据科学 - 环境设置
- Python 数据科学 - Pandas
- Python 数据科学 - Numpy
- Python 数据科学 - SciPy
- Python 数据科学 - Matplotlib
- Python 数据处理
- Python 数据操作
- Python 数据清理
- Python 处理 CSV 数据
- Python 处理 JSON 数据
- Python 处理 XLS 数据
- Python 关系数据库
- Python NoSQL 数据库
- Python 日期和时间
- Python 数据整理
- Python 数据聚合
- Python 读取 HTML 页面
- Python 处理非结构化数据
- Python 词汇标记化
- Python 词干提取和词形还原
- Python 数据可视化
- Python 图表属性
- Python 图表样式
- Python 箱线图
- Python 热力图
- Python 散点图
- Python 气泡图
- Python 3D 图表
- Python 时间序列
- Python 地理数据
- Python 图形数据
Python - 卡方检验
卡方检验是一种统计方法,用于确定两个分类变量是否在它们之间具有显著相关性。这两个变量都应来自同一总体,并且它们应为分类变量,如 - 是/否、男/女、红/绿等。例如,我们可以建立一个关于人们购买冰淇淋方式的数据集,并尝试将一个人的性别与他们喜欢的冰淇淋口味相关联。如果发现了相关性,我们可以通过了解来访人群的性别数量来计划适当的口味库存。
我们使用 numpy 库中的各种函数来执行卡方检验。
from scipy import stats import numpy as np import matplotlib.pyplot as plt x = np.linspace(0, 10, 100) fig,ax = plt.subplots(1,1) linestyles = [':', '--', '-.', '-'] deg_of_freedom = [1, 4, 7, 6] for df, ls in zip(deg_of_freedom, linestyles): ax.plot(x, stats.chi2.pdf(x, df), linestyle=ls) plt.xlim(0, 10) plt.ylim(0, 0.4) plt.xlabel('Value') plt.ylabel('Frequency') plt.title('Chi-Square Distribution') plt.legend() plt.show()
它的输出如下 -
广告