统计学 - 拟合优度



拟合优度检验用于检查样本数据是否符合总体分布。总体可能具有正态分布或威布尔分布。简单来说,它表示样本数据正确地代表了我们期望从实际总体中找到的数据。以下检验通常由统计学家使用

  • 卡方检验

  • Kolmogorov-Smirnov检验

  • Anderson-Darling检验

  • Shapiro-Wilk检验

卡方检验

卡方检验是最常用的拟合优度检验之一,用于离散分布(如二项分布和泊松分布),而Kolmogorov-Smirnov和Anderson-Darling拟合优度检验用于连续分布。

公式

${ X^2 = \sum {[ \frac{(O_i - E_i)^2}{E_i}]} }$

其中 -

  • ${O_i}$ = 变量第i个水平的观察值。

  • ${E_i}$ = 变量第i个水平的期望值。

  • ${X^2}$ = 卡方随机变量。

示例

一家玩具公司生产足球运动员玩具。它声称30%的卡片是中场球员,60%是后卫,10%是前锋。假设随机抽取100个玩具,其中50个是中场球员,45个是后卫,5个是前锋。在显著性水平为0.05的情况下,你能证明公司的说法吗?

解决方案

确定假设

  • 零假设 $ H_0 $ - 中场球员、后卫和前锋的比例分别为30%、60%和10%。

  • 备择假设 $ H_1 $ - 零假设中至少有一个比例是错误的。

确定自由度

自由度DF等于分类变量的水平数(k)减1:DF = k - 1。这里水平数为3。因此

${ DF = k - 1 \\[7pt] \, = 3 -1 = 2 }$

确定卡方检验统计量

${ X^2 = \sum {[ \frac{(O_i - E_i)^2}{E_i}]} \\[7pt] \, = [\frac{(50-30)^2}{30}] + [\frac{(45-60)^2}{60}] + [\frac{(5-10)^2}{10}] \\[7pt] \, = \frac{400}{30} + \frac{225}{60} + \frac{25}{10} \\[7pt] \, = 13.33 + 3.75 + 2.50 \\[7pt] \, = 19.58 }$

确定p值

P值是具有2个自由度的卡方统计量$ X^2 $大于19.58的概率。使用卡方分布计算器查找$ { P(X^2 \gt 19.58) = 0.0001 } $。

解释结果

由于P值(0.0001)远小于显著性水平(0.05),因此不能接受零假设。因此,公司的说法是无效的。

广告