如何在R数据框中查找重复行计数(如果大于n)?
要查找R数据框中重复行的计数(如果大于n),我们可以按照以下步骤操作:
- 首先,创建一个数据框。
- 然后,使用dplyr包的`group_by_all`、`count`和`filter`函数来统计重复行,如果它们大于某个数字。
创建数据框
让我们创建一个如下所示的数据框:
x<-rpois(30,1) y<-rpois(30,1) df<-data.frame(x,y) df
执行上述脚本后,将生成以下输出(由于随机化,此输出将在您的系统上有所不同):
x y 1 1 3 2 0 2 3 0 2 4 0 2 5 2 1 6 1 0 7 0 0 8 1 2 9 1 2 10 2 1 11 0 3 12 1 1 13 1 1 14 0 0 15 0 0 16 0 1 17 0 0 18 0 1 19 0 1 20 2 0 21 1 2 22 3 1 23 1 0 24 1 0 25 1 3 26 1 0 27 1 1 28 2 1 29 1 2 30 0 4
如果重复行数大于某个数字,则统计重复行数
加载dplyr包,并使用`group_by_all`、`count`和`filter`函数来查找如果重复行数大于2的重复行计数:
x<-rpois(30,1) y<-rpois(30,1) df<-data.frame(x,y) library(dplyr) df%>%group_by_all()%>%count()%>%filter(n>2)
输出
# A tibble: 7 x 3 # Groups: x, y [7] x y n <int> <int> <int> 1 0 0 4 2 0 1 3 3 0 2 3 4 1 0 4 5 1 1 3 6 1 2 4 7 2 1 3
广告