统计 - 箱线图



箱线图是一种标准化的显示数据分布的方法,它基于以下五数概括。

  1. 最小值

  2. 第一四分位数

  3. 中位数

  4. 第三四分位数

  5. 最大值

对于均匀分布的数据集,在箱线图中,中心矩形跨越第一四分位数到第三四分位数(或四分位数间距,IQR)。矩形内的线显示中位数,“须”显示最小值和最大值的位置。这种箱线图显示了从最小值到最大值的全部变异范围、可能的变异范围、IQR和中位数。

Box Plot

问题陈述

为以下两个数据集创建一个箱线图。

0.22
-0.87
-2.39
-1.79
0.37
-1.54
1.28
-0.31
-0.74
1.72
0.38
-0.17
-0.62
-1.10
0.30
0.15
2.30
0.19
-0.50
-0.09
-5.13
-2.19
-2.43
-3.83
0.50
-3.25
4.32
1.63
5.18
-0.43
7.11
4.87
-3.10
-5.81
3.76
6.31
2.58
0.07
5.76
3.50

解决方案

这里两个数据集都围绕零均匀平衡,所以均值大约为零。在第一个数据集中,变异范围大约从-2.5到2.5,而在第二个数据集中,变异范围大约从-6到6。绘制如下所示的图表。

Box Plot
广告