如何根据数值列和类别列对 R 数据框进行子集选择?


子集选择是一种常用的技术,根据分析目标的不同,它可以用于许多不同的目的。为了使用 dplyr 包排除一列来对数据框进行子集选择,我们可以按照以下步骤操作:

  • 创建数据框。
  • 同时根据数值列和类别列对数据框进行子集选择,使用 dplyr 包中的 filter 函数。

创建数据框

让我们创建一个如下所示的数据框:

 实时演示

Level<-sample(c("Low","Medium","High"),20,replace=TRUE)
Score<-sample(1:10,20,replace=TRUE)
Dat<-data.frame(Level,Score)
Dat

执行上述脚本后,将生成以下输出(由于随机化,此输出在您的系统上可能会有所不同):

  Level Score
1 High   4
2 Low    7
3 High   1
4 Medium 6
5 Medium 10
6 High   9
7 High 9
8 Low 3
9 Low 3
10 High 4
11 Low 5
12 Medium 3
13 High 8
14 High 10
15 High 5
16 Low 8
17 High 10
18 High 7
19 Low 10
20 Low 6

基于数值列和类别列进行子集选择

加载 dplyr 包并对 Dat 进行子集选择,其中 Score 列大于 5 且 Level 等于 Low:

library(dplyr)
Level<-sample(c("Low","Medium","High"),20,replace=TRUE)
Score<-sample(1:10,20,replace=TRUE)
Dat<-data.frame(Level,Score)
Dat%>%filter(Score>5,Level=="Low")

输出

 Level Score
1 Low 7
2 Low 8
3 Low 10
4 Low 6

更新于: 2021年8月13日

2K+ 次浏览

开启你的 职业生涯

通过完成课程获得认证

立即开始
广告