如何在R数据框中根据另一列选择包含最大值的行?


为了在R数据框中根据另一列选择包含最大值的行,我们可以按照以下步骤操作:

  • 首先,创建一个包含一个数值列和一个分类列的数据框。
  • 然后,使用tapply函数和max函数根据另一列查找数值列中包含最大值的行。

示例1

创建数据框

让我们创建一个如下所示的数据框:

 在线演示

x<-rnorm(20)
factor1<-sample(LETTERS[1:4],20,replace=TRUE)
df1<-data.frame(x,factor1)
df1

执行上述脚本后,将生成以下输出(由于随机化,此输出会在您的系统上有所不同):

      x    factor1
1 -1.21231516 A
2 -0.01576519 B
3 0.59032593 D
4 -0.41583339 C
5 -0.38508102 A
6 -0.61177209 C
7 -0.52961795 C
8 0.30561837 A
9 -0.58067776 A
10 0.62246173 C
11 -0.58479709 C
12 0.09817433 B
13 1.11240042 C
14 0.29007306 B
15 -0.66345792 B
16 -1.80789902 A
17 0.33419804 C
18 -0.15665767 A
19 1.56775923 C
20 1.49345799 B

查找基于另一列包含最大值的行

使用tapply函数根据df1中的factor1列查找x列中行的最大值:

 在线演示

x<-rnorm(20)
factor1<-sample(LETTERS[1:4],20,replace=TRUE)
df1<-data.frame(x,factor1)
tapply(df1$x,df1$factor1,max)

输出

      A          B       C       D
0.3056184 1.4934580 1.5677592 0.5903259

示例2

创建数据框

让我们创建一个如下所示的数据框:

 在线演示

y<-sample(1:50,20)
factor2<-sample(c("Low","Medium","High"),20,replace=TRUE)
df2<-data.frame(y,factor2)
df2

执行上述脚本后,将生成以下输出(由于随机化,此输出会在您的系统上有所不同):

y factor2
1 45 Low
2 2 Medium
3 5 High
4 33 Low
5 28 High
6 37 Medium
7 7 High
8 21 High
9 48 Low
10 18 High
11 15 High
12 38 High
13 20 Medium
14 4 Low
15 22 Medium
16 34 Low
17 32 Low
18 29 Low
19 24 High
20 17 Medium

查找基于另一列包含最大值的行

使用tapply函数根据df2中的factor2列查找y列中行的最大值:

tapply(df2$y,df2$factor2,max)

输出

High Low Medium
38 48 37

更新于:2021年8月13日

781 次浏览

启动你的职业生涯

完成课程获得认证

开始
广告