607 次浏览
子集是数据分析中最重要的方面之一。其中一种情况可能是根据多个值对字符列进行子集化。例如,如果 R 数据框的字符列有 5 个类别,那么我们可能希望仅提取 2 或 3 或 4 个值,则可以使用 dplyr 包的 filter 函数和 stringr 包的 str_detect 函数来实现。考虑以下数据框 -示例实时演示组
122 次浏览
如果一个向量值存在于另一个向量中,那么我们可能希望找到该值在另一个向量中的频率/计数。例如,如果我们有两个向量,例如 x 和 y,并且 y 中的一些值也存在于 x 中。因此,我们可以使用命令 colSums(outer(x,y,"==")) 找到 x 中 y 值的频率。示例实时演示x1
469 次浏览
如果我们在数据框中存储了时间序列数据,那么不能直接将其绘制为时间序列,并且可能也无法直接显示序列的标签。因此,我们首先需要使用 ts 函数将数据框转换为时间序列对象,如以下示例所示,然后使用 plot 函数创建绘图,这也会显示序列的标签。考虑以下数据框 -示例实时演示时间
590 次浏览
小计是指根据分组列查找值的总和。例如,如果我们有一个名为 df 的数据框,其中包含三个数值列 x、y、z 和一个分类列,例如 Group,那么可以使用命令 aggregate(cbind(x,y,z)~Group,data=df,FUN=sum) 找到 Group 中每个类别 x、y、z 的小计。考虑以下数据框 -示例实时演示x1
197 次浏览
要创建仅包含递增值的随机整数向量,我们可以使用 sample.int 进行随机采样,并使用 cummax 函数来获取递增值。例如,要创建大小为 5、最大值为 5、起始值为 1 的随机整数向量,可以使用命令 cummax(sample.int(5))。示例实时演示x1
2K+ 次浏览
当我们执行任何类型的数据分析时,会在 R 环境中创建许多类型的对象,例如向量、数据框、矩阵、列表、数组等。如果我们想要获取 R 环境中可用数据框的列表,可以使用以下命令 -names(which(unlist(eapply(.GlobalEnv,is.data.frame))))示例实时演示x1
4K+ 次浏览
如果我们在 R 数据框中有一个数字列,并且该列中唯一值的个数较少,这意味着该数字列可以被视为一个因子。因此,我们可以将数字列转换为因子。要使用 dplyr 包执行此操作,我们可以使用 dplyr 包的 mutate_if 函数。加载 dplyr 包并将 BOD 数据集(在基础 R 中可用)中的数字列转换为因子列 -示例library(dplyr) str(BOD) 'data.frame': 6 obs. of 2 variables: $ Time : num 1 2 3 4 5 7 $ demand: num 8.3 10.3 19 16 15.6 19.8 - ... 阅读更多
要创建数字的反转,我们可以使用 stringi 包的 stri_reverse 函数。例如,如果我们有一个包含一些数字的向量 x,那么这些数字的反转将通过使用命令 stri_reverse(x) 生成。但输出将为字符形式,如果我们想要数值,则可以使用 as.numeric 函数。library(stringi)示例实时演示x1
3K+ 次浏览
要创建多个向量的组合,我们可以使用 expand.grid 函数。例如,如果我们有六个向量,例如 x、y、z、a、b 和 c,则可以使用命令 expand.grid(x,y,z,a,b,c) 创建这些向量的组合。示例实时演示x1
705 次浏览
如果我们在 R 数据框中有一个字符列,那么我们可能希望检查特定值是否存在于该列中。例如,如果我们有一个性别列,那么我们可能希望检查跨性别者是否存在于该列中。这可以使用 grepl 函数来实现。查看以下示例以了解其工作原理。考虑以下数据框 -示例实时演示x