444 次查看
要查找 R 数据框中 ID 对应的频率,我们可以使用 dplyr 包的 summarise 函数,在使用 group_by 函数定义 ID 后,我们想要查找频率的列也会放在 group_by 函数中。查看下面的示例以了解如何操作。示例 1以下代码片段创建了一个示例数据框 - ID
1K+ 次查看
要查找所有列按组的平均值,我们可以在定义组后使用 group_by 以及 summarise_all 函数和 mean 函数。例如,如果我们有一个名为 df 的数据框,其中包含一个分组列,例如 G,以及一些数值列,那么我们可以通过使用以下给出的命令来查找所有列按分组列值分组的平均值 - df%>%group_by(G)%>%summarise_all("mean")示例 1以下代码片段创建了一个示例数据框 - Grp
983 次查看
要查找 R 向量中每 n 个值的平均值,我们需要先将向量转换为具有基于 n 个值的行的矩阵,然后我们可以使用 colMeans 函数。例如,如果我们有一个名为 X 的向量,其中包含一百个值,那么我们可以通过使用下面给出的命令来查找每十个值的平均值 - colMeans(matrix(X,10))示例 1要查找 R 向量中每 n 个值的平均值,请使用以下给出的命令 - x1
2K+ 次查看
要更改基本 R 图中框的边框颜色,我们可以使用带有 col 参数的 box 函数,在其中我们可以传递除黑色以外的颜色,因为黑色是默认颜色。我们首先需要使用 plot 函数创建图形,然后使用 box 函数,如以下示例所示。示例 1要更改基本 R 图中框的边框颜色,请使用以下给出的命令 - plot(1:10) box(col="red")输出如果执行以上给出的命令,则会生成以下输出 - 示例 2要更改基本 R ... 阅读更多
14K+ 次查看
要查找 R 数据框列中最频繁的因子值,我们可以在为特定列创建表格后使用 which.max 函数和 names 函数。在进行因子分析时可能需要此操作,并且我们想知道哪个因子出现次数最多。查看下面的示例以了解如何操作。示例 1以下代码片段创建了一个示例数据框 - Factor_1
937 次查看
要提取 R 中列表中存储的每个矩阵的第一行,我们可以使用 lapply 函数。例如,如果我们有一个名为 LIST 的列表,其中包含一些矩阵,那么我们可以通过使用以下给出的命令来查找每个矩阵的第一行 - lapply(LIST,'[',1,)查看以下给出的示例以了解如何操作。示例以下代码片段创建了一个矩阵列表 - M1
要提取箱线图的异常值,我们可以使用 out 函数以及 boxplot 函数。例如,如果我们有一个名为 X 的向量,其中包含一些异常值,那么我们可以通过使用以下给出的命令来提取这些异常值 - boxplot(df$X, plot=FALSE)$out此命令不会创建图形,因为 plot 设置为 FALSE。示例以下代码片段创建了一个示例数据框 - df=data.frame(x=rlnorm(25)) df创建了以下数据框 - x 1 0.5699270 2 3.5812629 3 0.3507882 4 0.1400328 5 0.7239948 6 2.5494114 7 3.1243611 8 5.3207739 9 0.1672539 10 7.6235529 11 0.4950263 12 1.1713592 13 1.6590328 14 ... 阅读更多
300 次查看
有时缺失值是编码的,当我们在不替换这些缺失值的情况下执行分析时,分析结果变得有点难以解释,特别是对于第一次阅读的人来说难以理解。因此,我们可能希望删除包含编码缺失值的行。为此,我们可以将编码缺失值替换为 NA,然后替换包含 NA 的行,如以下给出的示例所示。示例 1以下代码片段创建了一个数据框,如果缺失值编码为 1 - x1
752 次查看
要将 R 数据框列中零替换为前一个值,我们可以使用 zoo 包的 na.locf 函数,但要应用此函数,我们需要先将零值替换为 NA。例如,如果我们有一个名为 df 的数据框,其中包含一个名为 Rate 的列,那么我们可以使用以下命令来使用以下给出的命令将 Rate 中的 0 值替换为前一个值 - df$Rate[df$Rate==0]
966 次查看
如果我们想要添加 R 数据框的两列,并且每一列都包含缺失值,那么可以通过以下方式之一添加列 -如果它们是数字,则添加两列的值。如果其中一列具有缺失值,则返回数字。如果两列都具有缺失值,则返回 NA。为此,我们可以借助 apply 函数和 ifelse 函数,如以下给出的示例所示。示例 1以下代码片段创建了一个示例数据框 - x1