如何从 R 中的箱线图中提取离群值?
若要提取箱线图的离群值,可将 out 函数与 boxplot 函数搭配使用。例如,如果我们有一个名为 X 的向量其中包含一些离群值,则可通过使用以下提供的命令提取这些离群值 −
boxplot(df$X,plot=FALSE)$out
该命令不会创建绘图,因为 plot 已设置为 FALSE。
示例
以下代码段创建一个样本数据帧 −
df=data.frame(x=rlnorm(25)) df
创建以下数据帧 −
x 1 0.5699270 2 3.5812629 3 0.3507882 4 0.1400328 5 0.7239948 6 2.5494114 7 3.1243611 8 5.3207739 9 0.1672539 10 7.6235529 11 0.4950263 12 1.1713592 13 1.6590328 14 0.4404338 15 0.1354914 16 0.6192213 17 1.0878246 18 0.4084088 19 0.3980110 20 1.3915935 21 0.8679156 22 1.5447279 23 0.9476949 24 0.4036890 25 3.6822067
若要创建 x 的箱线图,请在上述代码段中添加以下代码 −
df=data.frame(x=rlnorm(25)) boxplot(df$x)
输出
如果执行所有上述代码段作为单个程序,将生成以下输出: −
若要从上述箱线图中提取离群值,请在上述代码段中添加以下代码 −
df=data.frame(x=rlnorm(25)) boxplot(df$x,plot=FALSE)$out
输出
如果执行所有上述代码段作为单个程序,将生成以下输出: −
[1] 3.581263 5.320774 7.623553 3.682207
广告