5K+ 阅读量
要查找列表元素的平均值,我们需要将这些元素取消列表化。例如,如果我们有一个名为 List 的列表,其中包含三个大小相同或不同的元素,例如 element1、element2 和 element3,那么我们可以使用 mean(unlist(List)) 来查找所有列表元素的平均值。示例 1List1
126 阅读量
在数据分析中,填充空白并非易事,尤其是在向量包含数值或整数时。假设我们有一个向量 x,其中包含 1、, 2、3、4、5,并且我们希望在第一个值之后的空白处放置 1,则可以使用 cummax 函数以及 seq_along 函数,如 x[cummax(seq_along(x)*(x!=""))]。示例 1 在线演示x1
683 阅读量
如果我们想要基于特定列删除包含缺失值的行,那么我们应该选择该列,同时忽略缺失值。这可以通过使用 is.na 函数来实现。例如,如果我们有一个包含列 x、y、z 的数据框 df,并且每列都有一些缺失值,那么可以按如下方式选择不包含缺失值的 x 行:df[!is.na(df$x),]。示例请考虑以下数据框 - 在线演示x1
4K+ 阅读量
可以使用组合函数 c 来连接向量。例如,如果我们有三个向量 x、y、z,那么这些向量的连接可以表示为 c(x,y,z)。此外,我们还可以使用相同的函数同时连接不同类型的向量。示例 1 在线演示set.seed(999) x1
68 阅读量
基于两个不同的字符列计算整数列的总和,简单来说就是我们需要为可用数据创建一个列联表。为此,我们可以使用 with 和 tapply 函数。例如,如果我们有一个数据框 df,其中包含两个定义为性别和种族的分类列,以及一个定义为 Package 的整数列,那么可以按如下方式创建列联表:with(df,tapply(Package,list(gender,ethnicity),sum))示例请考虑以下数据框 - 在线演示set.seed(777) Class
1K+ 阅读量
一个列表可以包含多个不同类型或相同类型的元素的列表,例如数据框、向量、矩阵等,但访问这些元素会变得有点困难。因此,最好将包含多个列表的列表转换为单个列表,这可以通过使用 unlist 函数来实现。示例请考虑以下向量 - set.seed(871) x1
135 阅读量
如果我们想要轻松地找到两期移动平均值,那么它无法在基础 R 中完成。我们需要使用 zoo 包的 rollmean 函数,它可以用一行代码解决此问题。例如,如果我们有一个向量 x,其中包含从 1 到 100 的一百个数字,那么可以使用 rollmean(x,2) 来找到 x 的两期移动平均值加载 zoo 包 - library(zoo)示例 在线演示x1
2K+ 阅读量
与用于统计分析的其他工具一样,R 不会将箱线图的标签显示为斜体,因此如果我们想要这样做,我们需要手动执行。在 ggplot2 中,我们有一个函数 scale_x_discrete,它可以通过使用 expression 函数将默认字体更改为斜体。示例 在线演示请考虑以下数据框 - set.seed(121) x
193 阅读量
如果我们有命名向量,但名称来自同一个系列,那么它们不能直接相加以获得基于名称的值之和。要做到这一点,我们需要使用 tapply 函数。例如,如果我们定义了三个向量 x、y 和 z,那么首先需要将它们组合成 V
845 阅读量
特殊字符通常被视为字符串值,并且可以在 stringr 包的 str_count 函数的帮助下进行计数。例如,如果我们有一个向量 x,其中包含 $、#、%、^、&、*、@、! 或任何其他特殊字符,那么我们可以使用 str_count(x,"\$") 来计算向量 x 中 $ 的数量,这可以对所有特殊字符分别执行。示例 1x1