1K+ 次浏览
R 中数据框的副本可以使用 sapply 函数创建,要设置要重复数据框的次数,可以使用 rep.int 的 times 参数。例如,如果我们有一个数据框 df,并且我们想要创建 5 个 df 的副本并将其添加到原始数据框中,则可以使用 sapply(df,rep.int,times=5)。示例 在线演示考虑以下数据框 −set.seed(151) x1
6K+ 次浏览
要从日期中查找一年中的某一天,我们可以使用 lubridate 包的 yday 函数。例如,如果我们有一个日期或日期向量,那么我们只需使用以下语法将该日期或向量传递到 yday 函数中:yday(“date”) 或 yday(“vector_of_date”)加载 lubridate 包 −library(lubridate)示例date1
3K+ 次浏览
要查找行均值,我们可以使用 rowMeans 函数,但如果数据框中有一些缺失值,则可以像计算列均值一样使用 na.rm=TRUE 参数。例如,如果我们有一个包含两列 x 和 y 的数据框 df,每一列都有一些缺失值,那么可以按 rowMeans(df,na.rm=TRUE) 计算行均值。示例考虑以下数据框 − 在线演示set.seed(1515) x1
2K+ 次浏览
箱线图最重要的方面之一是 Y 轴标签,因为这些标签有助于我们理解变量的限制。由于 R 以良好的方式自动生成这些标签,因此我们坚持使用它,但我们可以使用 coord_cartesian 函数和 ylim 来更改它,如下例所示。示例 在线演示考虑以下数据框 −set.seed(1212) x
要使用中位数替换缺失值,我们可以使用与使用均值替换缺失值相同的技巧。例如,如果我们有一个包含列 x 和 y 的数据框 df,其中两列都包含一些缺失值,则可以使用中位数替换缺失值,方法为 df$x[is.na(df$x)]
有时我们想知道 R 数据框列中的某个位置的值是多少,这有助于我们理解数据收集或数据模拟过程。例如,如果我们有一个包含列 x、y 和 z 的数据框 df,每个列都有 5000 个值,那么我们可以使用 df$x[[253]] 来查找数据框 df 的 x 列的第 253 行的值。示例考虑以下数据框 − 在线演示set.seed(987) x
要使用 ggplot2 创建累积和的点图,我们需要在 aes 函数中对因变量使用 cumsum 函数进行美学映射,该映射描述了变量的绘制方式。例如,如果我们有一个包含列 x 和 y 的数据框 df,其中 y 是因变量,则可以按 ggplot(df,aes(1:20,y=cumsum(y)))+geom_point() 创建累积和的点图。示例考虑以下数据框 − 在线演示set.seed(666) x
964 次浏览
如果我们有两个大小相同的列表,那么我们可以使用这些列表创建一个数据框,这可以使用 expand.grid 函数轻松完成。expand.grid 函数根据提供的列表、向量或因子的所有组合创建数据框。例如,如果我们定义了两个列表 List1 和 List2,那么我们可以使用代码 expand.grid(List1,List2) 创建一个数据框。示例 在线演示考虑以下列表 −List1
在数学中,当两个向量相乘时,输出是一个标量量,它是值的乘积之和。例如,如果我们有两个向量 x 和 y,每个向量都包含 1 和 2,那么这两个向量的乘积将是 5。在 R 中,我们可以使用 t(x)%*%y 来做到这一点。示例 1 在线演示x1
众所周知,可以使用 R 中的 sample 函数创建随机样本。如果我们只想创建具有 0 和 1 值的随机样本,那么有三种不同的方法可以将它们传递到 sample 函数中 −创建 0 和 1 的向量使用 0:1直接在函数中使用 c(1,2)。此外,我们可以根据需要将 replace 参数设置为 TRUE 或 FALSE。示例 在线演示x1