Python - 卡方检验



卡方检验是一种统计方法,用于确定两个分类变量是否在它们之间具有显著相关性。这两个变量都应来自同一总体,并且它们应为分类变量,如 - 是/否、男/女、红/绿等。例如,我们可以建立一个关于人们购买冰淇淋方式的数据集,并尝试将一个人的性别与他们喜欢的冰淇淋口味相关联。如果发现了相关性,我们可以通过了解来访人群的性别数量来计划适当的口味库存。

我们使用 numpy 库中的各种函数来执行卡方检验。

from scipy import stats import numpy as np import matplotlib.pyplot as plt x = np.linspace(0, 10, 100) fig,ax = plt.subplots(1,1) linestyles = [':', '--', '-.', '-'] deg_of_freedom = [1, 4, 7, 6] for df, ls in zip(deg_of_freedom, linestyles): ax.plot(x, stats.chi2.pdf(x, df), linestyle=ls) plt.xlim(0, 10) plt.ylim(0, 0.4) plt.xlabel('Value') plt.ylabel('Frequency') plt.title('Chi-Square Distribution') plt.legend() plt.show()

它的输出如下 -

chisquare.png
广告