统计学 - 区间估计



区间估计是指利用样本数据计算未知总体参数可能(或概率)值的区间,与点估计形成对比,点估计是一个单一数字。

公式

${\mu = \bar x \pm Z_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt n}}$

其中 -

  • ${\bar x}$ = 均值

  • ${Z_{\frac{\alpha}{2}}}$ = 置信系数

  • ${\alpha}$ = 置信水平

  • ${\sigma}$ = 标准差

  • ${n}$ = 样本量

示例

问题陈述

假设一名学生测量某种液体的沸点,在6个不同的液体样本上观察到读数(以摄氏度为单位)分别为102.5、101.7、103.1、100.9、100.5和102.2。他计算出样本均值为101.82。如果他知道此过程的标准差为1.2度,那么在95%置信水平下,总体均值的区间估计是多少?

解决方案

该学生计算出沸点样本均值为101.82,标准差为${\sigma = 0.49}$。95%置信区间的临界值为1.96,其中${\frac{1-0.95}{2} = 0.025}$。未知均值的95%置信区间。

${ = ((101.82 - (1.96 \times 0.49)), (101.82 + (1.96 \times 0.49))) \\[7pt] \ = (101.82 - 0.96, 101.82 + 0.96) \\[7pt] \ = (100.86, 102.78) }$

随着置信水平的降低,相应区间的长度也会减小。假设该学生对沸点的90%置信区间感兴趣。在这种情况下,${\sigma = 0.90}$,并且${\frac{1-0.90}{2} = 0.05}$。此水平的临界值等于1.645,因此90%置信区间为

${ = ((101.82 - (1.645 \times 0.49)), (101.82 + (1.645 \times 0.49))) \\[7pt] \ = (101.82 - 0.81, 101.82 + 0.81) \\[7pt] \ = (101.01, 102.63)}$

样本量的增加将缩短置信区间的长度,而不会降低置信水平。这是因为随着n的增加,标准差会减小。

误差范围

区间估计的误差范围${m}$定义为加到或减去样本均值的值,该值决定了区间的长度

${Z_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt n}}$

假设在上例中,学生希望在95%置信度下获得误差范围等于0.5。将适当的值代入${m}$的表达式并求解n得到计算结果。

${ n = {(1.96 \times \frac{1.2}{0.5})}^2 \\[7pt] \ = {\frac{2.35}{0.5}^2} \\[7pt] \ = {(4.7)}^2 \ = 22.09 }$

为了实现沸点均值的95%区间估计,总长度小于1度,学生将不得不进行23次测量。

广告
© . All rights reserved.