如何在R中提取数据框列表中的列?


在数据分析中,我们经常需要提取单个值、单行或单列用于特定分析。例如,如果数据框包含定义为身高和体重的列,那么我们可能只想使用身高,然后可以提取它,这也可以是列表的一部分,因此需要从列表中提取。如果我们有一个数据框列表,则可以使用双方括号访问数据框和列号来提取列表中某个数据框的列,如下例所示。

示例1

考虑以下数据框:

在线演示

> x1<-rnorm(10)
> x2<-rnorm(10)
> df1<-data.frame(x1,x2)
> df1

输出

     x1       x2
1  0.2378371  0.51433808
2  0.0638975 -1.66077353
3  0.3987209  0.68480587
4 -1.1321073  0.29528261
5 -0.5603269  1.14556819
6  2.2072545 -1.20718355
7  0.8196423  0.38380242
8 -2.2394064  0.06741712
9 -0.7356725 -1.46968026
10 -1.4642820 -1.39423679

示例

在线演示

> y1<-rnorm(10)
> y2<-rnorm(10)
> df2<-data.frame(y1,y2)
> df2

输出

      y1      y2
1  2.2307515  0.375538934
2 -1.3539616 -0.169574915
3 -0.1332480 -0.788416414
4  1.3181498  1.887995737
5 -1.4384012  1.261034365
6  0.3725585 -0.493219141
7 -0.7806511 -1.177616450
8 -0.4772392  0.250962895
9 -0.8932982 -0.004567268
10 0.2224190 -0.203232106

示例

> List1<-list(df1,df2)
> List1

输出

[[1]]
      x1       x2
1  0.2378371  0.51433808
2  0.0638975 -1.66077353
3  0.3987209  0.68480587
4 -1.1321073  0.29528261
5 -0.5603269  1.14556819
6  2.2072545 -1.20718355
7  0.8196423  0.38380242
8 -2.2394064  0.06741712
9 -0.7356725 -1.46968026
10 -1.4642820 -1.39423679

[[2]]
        y1       y2
1  2.2307515  0.375538934
2 -1.3539616 -0.169574915
3 -0.1332480 -0.788416414
4  1.3181498  1.887995737
5 -1.4384012  1.261034365
6  0.3725585 -0.493219141
7 -0.7806511 -1.177616450
8 -0.4772392  0.250962895
9 -0.8932982 -0.004567268
10 0.2224190 -0.203232106

从List1中的数据框2提取第2列:

示例

在线演示

> List1[[2]][[2]]

输出

[1]  0.375538934 -0.169574915 -0.788416414 1.887995737 1.261034365
[6] -0.493219141 -1.177616450 0.250962895 -0.004567268 -0.203232106

List2

示例

在线演示

> a1<-rnorm(10)
> a2<-rnorm(10)
> df3<-data.frame(a1,a2)
> df3

输出

      a1      a2
1  1.5711728  0.2861241
2  0.8062374  0.9469154
3  1.1505496 -0.5894829
4  0.9164866 -0.3137043
5 -1.3424446 -1.2921698
6 -0.1499540 -0.8940665
7 -0.1498557 -1.1361156
8  0.9299988  0.7679135
9 -1.7079005 -0.7099908
10 0.8146867 1.3921303

示例

在线演示

> b1<-rnorm(10)
> b2<-rnorm(10)
> df4<-data.frame(b1,b2)
> df4

输出

     b1       b2
1 -1.7113866 1.7014637
2 -0.0202485 1.2428109
3 -0.3892979 -1.5831333
4  0.2127277 -0.4943695
5 -0.4846616 1.0283278
6 -1.4116239 -1.4882983
7 -0.1737286 -0.1101114
8  1.4613389 0.1531942
9 -0.1573986 0.3431330
10 -0.2782074 0.5439397

示例

> List2<-list(df3,df4)
> List2

输出

[[1]]
     a1      a2
1 1.5711728 0.2861241
2 0.8062374 0.9469154
3 1.1505496 -0.5894829
4 0.9164866 -0.3137043
5 -1.3424446 -1.2921698
6 -0.1499540 -0.8940665
7 -0.1498557 -1.1361156
8 0.9299988 0.7679135
9 -1.7079005 -0.7099908
10 0.8146867 1.3921303

[[2]]
b1 b2
1 -1.7113866 1.7014637
2 -0.0202485 1.2428109
3 -0.3892979 -1.5831333
4 0.2127277 -0.4943695
5 -0.4846616 1.0283278
6 -1.4116239 -1.4882983
7 -0.1737286 -0.1101114
8 1.4613389 0.1531942
9 -0.1573986 0.3431330
10 -0.2782074 0.5439397

从List2中的数据框1提取第2列:

示例

> List2[[1]][[2]]

输出

[1] 0.2861241 0.9469154 -0.5894829 -0.3137043 -1.2921698 -0.8940665
[7] -1.1361156 0.7679135 -0.7099908 1.3921303

更新于:2021年1月2日

686 次浏览

开启您的职业生涯

完成课程获得认证

开始学习
广告