三维数组是一个三维数组,它实际上是二维数组的集合。我们可以通过使用simplify2array函数在R中创建数据框的三维数组,此函数将数据框分解成将构成三维数组的数组。示例1考虑以下数据框:在线演示> set.seed(254) > x y z a b c df1 df1输出x y z a b c 1 0 4 6 9 5 5 2 0 5 1 4 2 1 3 0 6 1 4 5 6 4 1 6 3 5 4 12 5 1 9 8 6 6 11 6 ... 阅读更多
要创建字符串向量的频数表,我们只需要使用table函数。例如,如果我们有一个向量x,其中包含前五个英文字母的100个随机采样值,那么可以使用table(x)创建向量x的表。这将生成一个表以及向量的名称。示例1在线演示> x1 x1输出[1] "d" "d" "a" "c" "a" "a" "c" "a" "d" "c" "a" "d" "d" "b" "c" "a" "b" "c" "d" [20] "b"示例> table(x1)输出x1 a b c d 6 3 5 6示例2在线演示> x2 x2输出[1] "w" "j" "p" "y" "r" ... 阅读更多
在R数据框中创建重复列最简单的方法是使用$符号设置新列,如果我们想要不同的名称,我们可以简单地传递一个新名称。例如,如果我们有一个包含列x的数据框df,并且我们想要一个具有与x中相同值的新列x1,那么可以将其设置为df$x1 set.seed(254) > x y z a b c df df输出x y z a b c 1 A 0.8709244 9 0.072625990 5.125432 26.84561 2 B 1.7993156 3 ... 阅读更多
查找分组均值是一件常见的事情,但是如果我们进行逐步分析,那么当我们的数据集中有分类变量时,也需要值的总和。这可以很容易地通过dplyr包的group_by和summarise_each函数来完成。示例考虑以下数据框:在线演示> Group Salary Emp Emp输出Group Salary 1 D 28256 2 B 31092 3 A 23147 4 C 28209 5 B 37676 6 C 33374 7 D 44864 8 B 40152 9 A 25843 10 A 40946 11 D 23321 12 A 42854 13 C 36960 14 A 35285 15 ... 阅读更多