683 次浏览
如果我们想要删除包含基于特定列的缺失值的行,我们应该选择该列,同时忽略缺失值。这可以通过使用 is.na 函数来实现。例如,如果我们有一个包含列 x、y、z 的数据框 df,并且每一列都有一些缺失值,那么可以选择没有缺失值的 x 的行,方法是 df[!is.na(df$x),]。示例考虑下面的数据框 - 实时演示x1
4K+ 次浏览
向量的连接可以通过使用组合函数 c 来完成。例如,如果我们有三个向量 x、y、z,那么这些向量的连接可以表示为 c(x,y,z)。此外,我们可以使用相同的函数同时连接不同类型的向量。示例 1 实时演示set.seed(999) x1
68 次浏览
基于两个不同的字符列计算整数列的总和,简单来说就是我们需要为现有数据创建一个列联表。为此,我们可以使用 with 和 tapply 函数。例如,如果我们有一个数据框 df,其中包含两个定义为性别和种族的分类列,以及一个定义为 Package 的整数列,那么列联表可以创建为:with(df,tapply(Package,list(gender,ethnicity),sum))示例考虑下面的数据框 - 实时演示set.seed(777) Class
1K+ 次浏览
一个列表可以包含多个不同类型或相同类型的列表元素,例如数据框、向量、矩阵等等,但是访问这些元素会变得有点困难。因此,最好将包含多个列表的列表转换为单个列表,这可以使用 unlist 函数来完成。示例考虑下面的向量 - set.seed(871) x1
135 次浏览
如果我们想要轻松地找到双周期移动平均值,那么在基础 R 中无法做到。我们需要使用 zoo 包的 rollmean 函数,它可以用一行代码解决这个问题。例如,如果我们有一个向量 x,其中包含从 1 到 100 的一百个数字,那么 x 的双周期移动平均值可以通过使用 rollmean(x,2) 来找到。加载 zoo 包 - library(zoo)示例 实时演示x1
2K+ 次浏览
像其他所有统计分析工具一样,R 不会以斜体显示箱线图的标签,因此如果我们想这样做,我们需要手动完成。在 ggplot2 中,我们有一个函数 scale_x_discrete,它可以使用 expression 函数将默认字体更改为斜体。示例 实时演示考虑下面的数据框 - set.seed(121) x
193 次浏览
如果我们有命名向量,但名称来自同一个系列,那么它们不能直接加在一起以获得基于名称的值之和。要做到这一点,我们需要使用 tapply 函数。例如,如果我们有三个定义为 x、y 和 z 的向量,那么首先需要将它们组合为 V
845 次浏览
特殊字符通常被视为字符串值,可以使用 stringr 包的 str_count 函数来计算它们。例如,如果我们有一个向量 x,其中包含 $、#、%、^、&、*、@、! 或任何其他特殊字符,那么我们可以使用 str_count(x,"\$") 来计算向量 x 中 $ 的数量,这可以对所有特殊字符分别进行。示例 1 x1
8K+ 次浏览
如果我们想将一个对象转换为数据框,可以使用 as.data.frame 函数,我们只需要读取想要转换为 as.data.frame 的对象即可。例如,如果我们有一个向量 x,那么它可以通过使用 as.data.frame(x) 转换为数据框,这也可以对矩阵进行。示例 1 实时演示x
426 次浏览
创建包含交互作用的回归模型最简单的方法是输入带有乘号 * 的变量,但这会创建许多更高阶的其他组合。如果我们想创建两个变量组合的交互作用,可以使用幂运算符,如下面的示例所示。示例 1 实时演示x1