如何在R中选择数据框中不存在于另一个数据框中的行？

有时我们需要查找两个数据框之间不相同的行，而不是查找公共行。当我们预期不相同的行数很多而不是很少时，这通常很有用。我们可以使用否定运算符（用感叹号表示）和子集函数来做到这一点。

示例

考虑以下数据框：

> x1<-sample(1:10,20,replace=TRUE)
> y1<-sample(1:10,20,replace=TRUE)
> df1<-data.frame(x1,y1)
> df1

Explore our latest online courses and learn new skills at your own pace. Enroll and become a certified expert to boost your career.

> x2<-sample(1:10,20,replace=TRUE)
> y2<-sample(1:10,20,replace=TRUE)
> df2<-data.frame(x2,y2)
> df2

现在假设我们想要获取df2变量y2的一个子集，这些子集不存在于df1的y1中，那么可以按如下方式进行：

> subset(df2,!(y2%in%df1$y1))
x2 y2
16 1 7
<0 rows> (or 0-length row.names)

类似地，获取df2变量y2的一个子集，这些子集不存在于df1的x1中，那么可以按如下方式进行：

> subset(df2,!(y2%in%df1$x1))
[1] x2 y2
<0 rows> (or 0-length row.names)

让我们再看一个例子：

> x1<-rep(1:10,2)
> df1<-data.frame(x1)
> df1

> x2<-rep(1:5,4)
> df2<-data.frame(x2)
> df2

> subset(df1,!(x1%in%df2$x2))

Nizamuddin Siddiqui

更新于：2020年9月4日

2K+浏览量

通过完成课程获得认证