找到 2038 篇文章 关于 R 编程
404 次浏览
在 ggplot2 中,默认情况下,图例标题是数据框分组列的标题。如果我们想要更改该标题,则可以使用 `scale_color_discrete` 函数。例如,如果我们有一个名为 df 的数据框,其中包含两列数值列 x 和 y 以及一列分组列(例如 group),则可以使用以下命令创建具有不同图例标题的散点图:`ggplot(df, aes(x, y, color=group))+geom_point()+scale_color_discrete("Gender")` 示例 考虑以下数据框:演示 > x y grp df df 输出 x y grp 1 -2.27846496 0.8121008 ... 阅读更多
4K+ 次浏览
如果我们有一个向量和一个数据框,并且数据框有一列包含与向量中类似的值,那么我们可以根据该向量创建数据框的子集。这可以使用方括号和 `%in%` 运算符来完成。`%in%` 运算符将帮助我们查找数据框列中与向量值匹配的值。查看下面的示例,了解其工作原理。示例1 考虑以下数据框 df1 和向量 v1:演示 > x1 x2 df1 df1 输出 x1 x2 1 ... 阅读更多
2K+ 次浏览
要在 ggplot2 中显示 y 变量的平均线,我们可以使用 `geom_hline` 函数以及 `yintercept`。在 `yintercept` 中,我们需要计算 y 变量的均值,我们还可以使用 `geom_hline` 函数内的 `color` 参数更改线的颜色。示例 考虑以下数据框:演示 > x y df df 输出 x y 1 -1.07323904 0.368641641 2 0.92531148 -0.196530651 3 -0.57433739 0.710957804 4 1.17367100 0.300110517 5 0.00769624 -1.287517035 6 0.64901161 -0.476105351 7 0.70197701 -0.683592585 8 -0.80807441 -1.716264317 9 0.10827026 0.116964308 10 -1.10451308 0.660382307 11 -0.01612692 -1.182533283 12 2.20292198 -1.890223763 13 -1.03368161 -0.526983486 ... 阅读更多
596 次浏览
要创建随机整数向量,我们可以使用 `sample.int` 函数;如果我们想创建这样的整数矩阵,则将与它一起使用 `matrix` 函数。例如,如果我们想创建一个大小为 20、4 列和 5 行的、随机整数(介于 1 到 100 之间)的矩阵,则可以使用以下命令:`matrix(sample.int(100,size=20),nrow=5,ncol=4)` 示例1 演示 > M1 M1 输出 [,1] [,2] [,3] [,4] [1,] 61 8 68 81 [2,] 34 33 40 70 [3,] 76 29 51 41 [4,] 31 77 8 94 [5,] 35 57 50 29 [6,] 96 28 83 3 [7,] 11 68 71 81 [8,] 63 50 94 85 [9,] 21 53 99 94 [10,] 31 67 23 62 [11,] 56 47 68 66 [12,] 56 5 77 27 [13,] 59 95 88 64 [14,] 21 1 86 55 [15,] 8 3 72 17 [16,] 29 41 61 99 [17,] 7 62 48 56 [18,] 80 78 97 57 [19,] 26 96 34 19 [20,] 73 88 57 72 示例2 演示 > M2 M2 输出 [,1] [,2] [,3] [,4] [,5] [1,] 956 707 421 995 589 [2,] 525 300 595 548 109 [3,] 610 216 754 888 864 [4,] 744 240 997 246 371 [5,] 848 535 477 127 938 [6,] 836 648 241 597 608 [7,] 675 629 517 758 469 [8,] 238 433 296 249 776 [9,] 226 552 933 917 625 [10,] 111 584 643 699 573 [11,] 168 239 409 844 850 [12,] 587 387 587 899 672 [13,] 55 612 315 572 574 [14,] 765 646 925 848 584 [15,] 158 191 235 435 19 [16,] 68 631 493 604 65 [17,] 740 976 498 755 534 [18,] 241 548 921 265 343 [19,] 907 364 318 502 141 [20,] 150 739 614 444 189 示例3 演示 > M3 M3 输出 [,1] [,2] [1,] 2025 4158 [2,] 1372 4495 [3,] 2208 2306 [4,] 1091 476 [5,] 2635 4873 [6,] 1724 3327 [7,] 580 4051 [8,] 546 3927 [9,] 4115 2399 [10,] 1520 4577 [11,] 420 2441 [12,] 2251 1323 [13,] 2908 1415 [14,] 733 3886 [15,] 3556 844 [16,] 2181 2161 [17,] 2771 2349 [18,] 4805 2057 [19,] 2269 4561 [20,] 3110 1250 示例4 演示 > M4 M4 输出 [,1] [,2] [,3] [,4] [,5] [1,] 10 7 6 8 4 [2,] 2 3 9 7 6 [3,] 1 6 10 3 9 [4,] 8 1 8 7 3 [5,] 10 6 10 8 3 [6,] 2 3 9 7 10 [7,] 5 9 2 1 5 [8,] 6 4 10 1 7 [9,] 3 5 2 5 5 [10,] 2 9 8 8 7 [11,] 6 5 8 3 9 [12,] 4 1 9 6 7 [13,] 2 10 9 4 5 [14,] 10 5 2 1 2 [15,] 3 10 9 2 10 [16,] 3 6 8 8 7 [17,] 3 2 9 3 4 [18,] 9 3 3 5 4 [19,] 6 3 1 3 2 [20,] 3 7 1 7 5
569 次浏览
要将 NaN 值转换为 NA,我们需要检测数据框中的 NaN 值并将它们设置为 NA。例如,如果我们有一个名为 df 的数据框,其中包含一列 x,其中包含一些 NaN 值,那么我们可以使用命令 `df$x[is.nan(df$x)] <- NA` 将这些 NaN 转换为 NA。示例 考虑以下数据框 df1 和向量 v1:演示 > x1 x2 df1 df1 输出 x1 x2 1 NaN -0.44923302 2 NaN -0.12670027 3 1 0.59120380 4 1 -0.18782341 5 NaN -0.28730385 6 1 0.57412261 7 NaN -0.33620181 8 1 1.37168545 9 NaN -2.24121448 10 NaN 1.05990104 11 1 1.95544957 12 NaN -2.19544854 13 1 ... 阅读更多
4K+ 次浏览
要创建箱线图,我们有一列因子和一列数值列,并且为该因子中的每个类别或级别创建一个箱线图。现在,如果我们有两个因子,则可以通过在 `geom_boxplot` 中传递 `fill` 参数来为两个因子级别创建箱线图。这将帮助我们区分两个因子的箱线图。查看下面的示例,了解其工作原理。示例 考虑以下数据框:演示 > x y grp df df 输出 x y grp 1 Female 0.790349405 b ... 阅读更多
2K+ 次浏览
如果一行包含缺失值,则它们的总和将不是有限的,因此,我们可以使用 `is.finite` 函数和 `data.table` 对象来删除包含 NA 的行。例如,如果我们有一个名为 DT 的 data.table 对象,其中包含一些包含 NA 的行,则可以使用 `DT[is.finite(rowSums(DT))]` 删除这些行。示例1 加载 data.table 包并创建一个 data.table 对象:> library(data.table) > x1 x2 DT1 DT1 输出 x1 x2 1: 1 2 2: NA 4 3: 1 2 4: NA 5 5: 1 6 6: 1 8 7: NA 3 8: 1 ... 阅读更多
268 次浏览
在R数据框中查找列均值最简单的方法是使用colMeans函数,但如果不想使用它,则可以使用sapply函数实现。使用sapply时,需要确保只选择数据框的数值列。请查看以下示例以了解其工作原理。示例1考虑base R中的CO2数据框 −现场演示> head(CO2, 20)输出 Plant Type Treatment conc uptake 1 Qn1 Quebec nonchilled 95 16.0 2 Qn1 Quebec nonchilled 175 30.4 3 Qn1 ... 阅读更多
浏览量 5K+
要基于另一列赋值列值,可以使用ifelse函数。ifelse函数使用等号(==)检查一个数据框中的一列的值是否与另一个数据框中另一列的值匹配,然后如果不存在匹配项则用新列替换原始值,否则返回原始值。请查看以下示例以了解如何操作。示例考虑以下数据框 −现场演示> x1 x2 df1 df1输出 x1 x2 1 3 5 2 3 7 3 ... 阅读更多