找到 2038 篇文章 关于 R 编程
193 次查看
如果我们有一个向量,其中交替的值可能创建表格形式,那么我们可能希望将向量转换为数据框。为此,我们首先需要将向量转换为具有适当列/行数的矩阵,然后使用 as.data.frame 函数将其读取为数据框。查看以下示例以了解其工作原理。示例 1 实时演示> x1 x1输出[1] "1" "male" "1" "male" "1" "male" "1" "male" [9] "1" "male" "1" "male" "1" "male" "1" "male" [17] "1" "male" "1" "male" "2" "female" "2" "female" [25] "2" "female" "2" "female" "2" "female" ... 阅读更多
681 次查看
如果我们在 R 数据框中拥有因子列,那么我们希望找到所有因子列中每个因子水平的频率。这可以通过使用带有 table 函数的 sapply 函数来完成。例如,如果我们有一个名为 df 的数据框包含一些因子列,那么可以使用命令 sapply(df, table) 创建因子列的频数表。示例 1 考虑以下数据框 −实时演示> x1 x2 df1 df1输出 x1 x2 1 D a 2 D b 3 D c 4 D b 5 D c 6 C a ... 阅读更多
512 次查看
R 语言中没有内置函数来查找众数,因此我们需要创建一个函数,然后将其应用于矩阵的行。创建众数函数如下所示:−mode M1 M1Output [,1] [,2] [,3] [,4] [,5] [1,] 2 2 1 2 2 [2,] 2 2 2 2 1 [3,] 2 2 1 1 1 [4,] 2 1 1 1 1 [5,] 2 1 1 2 2> apply(M1,1,mode)Output[1] 2 2 1 1 2示例2在线演示> M2 M2Output [,1] [,2] [,3] [,4] [,5] [1,] 1 1 2 2 1 [2,] 2 1 1 2 1 [3,] 2 2 1 1 1 [4,] 2 1 1 2 2 [5,] 2 1 1 2 2 [6,] 1 2 1 1 2 [7,] 1 1 2 1 2 [8,] 2 2 1 2 1 [9,] 2 1 1 2 2 [10,] 1 1 2 2 2 [11,] 1 1 2 1 2 [12,] 1 2 2 2 1 [13,] 2 2 2 2 1 [14,] 2 1 2 2 1 [15,] 1 2 1 1 2 [16,] 2 2 1 2 1 [17,] 2 2 1 1 1 [18,] 2 1 1 2 1 [19,] 1 1 1 2 1 [20,] 2 1 1 2 2> apply(M2,1,mode)Output[1] 1 1 1 2 2 1 1 2 2 2 1 2 2 2 1 2 1 1 1 2示例3在线演示> M3 M3Output [,1] [,2] [,3] [,4] [,5] [1,] 1 3 3 2 1 [2,] 2 3 1 2 2 [3,] 2 2 3 3 1 [4,] 1 3 1 3 2 [5,] 3 1 2 1 2 [6,] 2 3 1 1 1 [7,] 2 2 2 3 1 [8,] 1 2 2 2 2 [9,] 2 1 2 1 2 [10,] 1 3 1 2 1 [11,] 2 1 3 1 1 [12,] 1 1 3 2 2 [13,] 2 1 1 1 2 [14,] 2 1 3 3 2 [15,] 1 2 3 1 2 [16,] 1 2 1 2 1 [17,] 3 1 1 3 2 [18,] 3 3 3 3 1 [19,] 3 2 3 1 1 [20,] 3 3 2 2 1> apply(M3,1,mode)Output[1] 1 2 2 1 1 1 2 2 2 1 1 1 1 2 1 1 1 3 1 2示例4在线演示> M4 M4Output [,1] [,2] [,3] [,4] [,5] [1,] 10 10 9 10 9 [2,] 9 9 10 9 9 [3,] 9 9 9 10 10 [4,] 10 9 9 10 10 [5,] 10 10 9 10 9 [6,] 10 10 9 10 10 [7,] 9 9 9 10 9 [8,] 9 10 9 10 9 [9,] 9 9 9 9 9 [10,] 9 10 9 10 9 [11,] 10 10 9 9 9 [12,] 9 9 9 9 9 [13,] 10 10 10 9 10 [14,] 10 9 10 10 10 [15,] 9 10 9 10 9 [16,] 9 10 9 10 9 [17,] 9 10 10 9 10 [18,] 9 9 9 9 10 [19,] 10 9 9 10 9 [20,] 10 9 9 10 9> apply(M4,1,mode)Output[1] 10 9 9 10 10 10 9 9 9 9 9 9 10 10 9 9 10 9 9 9
377 次查看
值的组合可以通过多种方式完成,其中一种方式是,如果我们有重复值或唯一值,则可以根据该值设置组。如果所有值都是唯一的,则分组没有意义,但如果我们有不同的值,则可以进行分组。为此,我们可以使用 rleid 函数,如下面的示例所示。示例1考虑以下数据框:−在线演示> x df1 df1Output x 1 2 2 1 3 2 4 2 5 1 6 ... 阅读更多
435 次查看
当我们有两个因子列和一个数值列时,我们可以为基于因子列的数值值的总计数创建一个列联表。这可以使用 base R 中的 xtabs 函数来完成。例如,如果我们有一个名为 df 的数据框,其中包含两个因子列,例如 f1 和 f2,以及一个数值列,例如 Y,则可以使用命令 xtabs(Y~f1+f1, df) 创建 df 的列联表。示例1考虑以下数据框:−在线演示> x1 x2 y1 df1 df1Output x1 x2 y1 1 B a 5 ... 阅读更多
1K+ 次查看
默认情况下,图例的形状是圆形的,但我们可以使用 ggplot2 包的 guides 函数来更改它。例如,如果我们有一个数据框,其中包含两个数值列,例如 x 和 y,以及一个分类列 Group,则可以通过使用以下命令创建 x 和 y 之间的散点图,其中分类列 Group 中的类别具有不同的颜色值和不同的图例形状:−ggplot(df, aes(x, y, color=Group))+geom_point()+guides(colour=guide_legend(override.aes=list(shape=0)))在这里,我们可以将 shape 参数值更改为从 0 到 25 之间的任何值。考虑以下数据框:−示例在线演示x阅读更多