如何在 R 中删除数据框子集中因子的水平?


有两种方法可以删除数据框子集中因子的水平,一种是使用因数函数,另一种是使用 lapply。

示例

> df <- data.frame(alphabets=letters[1:10], numbers=seq(0:9))
> levels(df$alphabets)
[1] "a" "b" "c" "d" "e" "f" "g" "h" "i" "j"
> subdf <- subset(df, numbers <= 6)
> subdf
alphabets numbers
1 a 1
2 b 2
3 c 3
4 d 4
5 e 5
6 f 6
> levels(subdf$alphabets)
[1] "a" "b" "c" "d" "e" "f" "g" "h" "i" "j"

尽管我们已经创建了一个子集,但因子变量字母的水平仍然显示为 10 个水平。如果我们想删除因子水平,则可以通过以下方式进行

使用因子函数

> subdf$alphabets <- factor(subdf$alphabets)
> levels(subdf$alphabets)
[1] "a" "b" "c" "d" "e" "f"

使用 lapply

> subdf[] <- lapply(subdf, function(x) if(is.factor(x)) factor(x) else x)
> levels(subdf$alphabets)
[1] "a" "b" "c" "d" "e" "f"

更新于: 2020-07-06

648 次浏览

开启你的 事业

完成课程即可获得认证

开始
广告