如何从 R 中的箱线图中提取离群值?


若要提取箱线图的离群值,可将 out 函数与 boxplot 函数搭配使用。例如,如果我们有一个名为 X 的向量其中包含一些离群值,则可通过使用以下提供的命令提取这些离群值 −

boxplot(df$X,plot=FALSE)$out

该命令不会创建绘图,因为 plot 已设置为 FALSE。

示例

以下代码段创建一个样本数据帧 −

df=data.frame(x=rlnorm(25))
df

创建以下数据帧 −

     x
1  0.5699270
2  3.5812629
3  0.3507882
4  0.1400328
5  0.7239948
6  2.5494114
7  3.1243611
8  5.3207739
9  0.1672539
10 7.6235529
11 0.4950263
12 1.1713592
13 1.6590328
14 0.4404338
15 0.1354914
16 0.6192213
17 1.0878246
18 0.4084088
19 0.3980110
20 1.3915935
21 0.8679156
22 1.5447279
23 0.9476949
24 0.4036890
25 3.6822067

若要创建 x 的箱线图,请在上述代码段中添加以下代码 −

df=data.frame(x=rlnorm(25))
boxplot(df$x)

输出

如果执行所有上述代码段作为单个程序,将生成以下输出: −

若要从上述箱线图中提取离群值,请在上述代码段中添加以下代码 −

df=data.frame(x=rlnorm(25))
boxplot(df$x,plot=FALSE)$out

输出

如果执行所有上述代码段作为单个程序,将生成以下输出: −

[1] 3.581263 5.320774 7.623553 3.682207

更新于: 11-11-2021

2K+ 浏览量

启动你的事业

完成课程,获得认证

开始
广告