如何在R数据框列中检查特定单词是否存在?


如果我们在R数据框中有一个字符列,我们可能需要检查特定值是否存在于该列中。例如,如果我们有一个性别列,我们可能需要检查“跨性别者”是否存在于该列中。这可以使用`grepl`函数来实现。查看下面的示例以了解其工作原理。

考虑以下数据框:

示例

 在线演示

x<-sample(c("Mazda","Merc","Fiat"),20,replace=TRUE)
df1<-data.frame(x)
df1

输出

   x
1  Fiat
2  Merc
3  Fiat
4  Merc
5  Merc
6  Fiat
7  Fiat
8  Fiat
9  Mazda
10 Fiat
11 Mazda
12 Mazda
13 Fiat
14 Fiat
15 Mazda
16 Mazda
17 Merc
18 Merc
19 Mazda
20 Merc

检查“Merc”是否在df1的x列中存在:

示例

grepl("Merc",df1$x)

输出

[1]  FALSE TRUE FALSE TRUE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
[13] FALSE FALSE FALSE FALSE TRUE TRUE FALSE TRUE

示例

 在线演示

y<-sample(c("Hotel","Motel","Restaurant"),20,replace=TRUE)
df2<-data.frame(y)
df2

输出

   y
1  Motel
2  Hotel
3  Motel
4  Motel
5  Hotel
6  Hotel
7  Motel
8  Motel
9  Hotel
10 Hotel
11 Restaurant
12 Restaurant
13 Motel
14 Hotel
15 Motel
16 Hotel
17 Hotel
18 Restaurant
19 Hotel
20 Hotel

检查“Motel”是否在df2的y列中存在:

示例

grepl("Motel",df2$y)

输出

[1] TRUE FALSE TRUE TRUE FALSE FALSE TRUE TRUE FALSE FALSE FALSE FALSE
[13] TRUE FALSE TRUE FALSE FALSE FALSE FALSE FALSE

更新于:2021年2月10日

705 次浏览

启动你的职业生涯

完成课程获得认证

开始学习
广告