如何根据数值列和类别列对 R 数据框进行子集选择?
子集选择是一种常用的技术,根据分析目标的不同,它可以用于许多不同的目的。为了使用 dplyr 包排除一列来对数据框进行子集选择,我们可以按照以下步骤操作:
- 创建数据框。
- 同时根据数值列和类别列对数据框进行子集选择,使用 dplyr 包中的 filter 函数。
创建数据框
让我们创建一个如下所示的数据框:
Level<-sample(c("Low","Medium","High"),20,replace=TRUE) Score<-sample(1:10,20,replace=TRUE) Dat<-data.frame(Level,Score) Dat
执行上述脚本后,将生成以下输出(由于随机化,此输出在您的系统上可能会有所不同):
Level Score 1 High 4 2 Low 7 3 High 1 4 Medium 6 5 Medium 10 6 High 9 7 High 9 8 Low 3 9 Low 3 10 High 4 11 Low 5 12 Medium 3 13 High 8 14 High 10 15 High 5 16 Low 8 17 High 10 18 High 7 19 Low 10 20 Low 6
基于数值列和类别列进行子集选择
加载 dplyr 包并对 Dat 进行子集选择,其中 Score 列大于 5 且 Level 等于 Low:
library(dplyr) Level<-sample(c("Low","Medium","High"),20,replace=TRUE) Score<-sample(1:10,20,replace=TRUE) Dat<-data.frame(Level,Score) Dat%>%filter(Score>5,Level=="Low")
输出
Level Score 1 Low 7 2 Low 8 3 Low 10 4 Low 6
广告