683 次浏览
如果我们想删除基于特定列包含缺失值的行,那么我们应该通过忽略缺失值来选择该列。这可以通过使用 is.na 函数来完成。例如,如果我们有一个包含列 x、y、z 的数据框 df,并且每列都有一些缺失值,那么可以选择没有缺失值的 x 行,例如 df[!is.na(df$x),]。示例请考虑以下数据框 - 实时演示x1
4K+ 次浏览
向量的连接可以通过使用组合函数 c 来完成。例如,如果我们有三个向量 x、y、z,那么这些向量的连接可以写成 c(x,y,z)。此外,我们还可以使用相同的函数同时连接不同类型的向量。示例 1 实时演示set.seed(999) x1
68 次浏览
基于两个不同的字符列计算整数列的总和,简单来说就是我们需要为可用数据创建一个列联表。为此,我们可以使用 with 和 tapply 函数。例如,如果我们有一个数据框 df,其中包含两个定义为性别和种族的分类列,以及一个定义为 Package 的整数列,那么列联表可以创建如下:with(df,tapply(Package,list(gender,ethnicity),sum))示例请考虑以下数据框 - 实时演示set.seed(777) Class
1K+ 次浏览
一个列表可以包含多个不同类型或类似类型元素的列表,例如数据框、向量、矩阵等等,但访问这些元素会变得有点困难。因此,最好将包含多个列表的列表转换为单个列表,这可以通过使用 unlist 函数来完成。示例请考虑以下向量 - set.seed(871) x1
135 次浏览
如果我们想轻松地找到双周期移动平均值,那么它在 R 基础包中无法实现。我们需要使用 zoo 包的 rollmean 函数,它可以在一行代码中解决此问题。例如,如果我们有一个向量 x,其中包含从 1 到 100 的一百个数字,那么 x 的双周期移动平均值可以通过使用 rollmean(x,2) 来找到加载 zoo 包 -library(zoo)示例 实时演示x1
2K+ 次浏览
像其他所有统计分析工具一样,R 不会以斜体显示箱线图的标签,因此如果我们想这样做,我们需要手动完成。在 ggplot2 中,我们有一个函数 scale_x_discrete,它可以通过使用 expression 函数将默认字体更改为斜体。示例 实时演示请考虑以下数据框 - set.seed(121) x
193 次浏览
如果我们有命名向量,但名称来自同一个家族,那么它们不能直接相互加和以根据名称获得值的总和。要做到这一点,我们需要使用 tapply 函数。例如,如果我们有三个定义为 x、y 和 z 的向量,那么首先需要将它们组合为 V
845 次浏览
特殊字符通常被视为字符串值,并且可以在 stringr 包的 str_count 函数的帮助下进行计数。例如,如果我们有一个向量 x,其中包含 $、#、%、^、&、*、@、! 或任何其他特殊字符,那么我们可以使用 str_count(x,"\$") 来计算向量 x 中 $ 的数量,这可以对所有特殊字符分别进行。示例 1x1
8K+ 次浏览
如果我们想将一个对象转换为数据框,那么可以使用 as.data.frame 函数,我们只需要读取想要转换的对象,并使用 as.data.frame。例如,如果我们有一个向量 x,那么它可以通过使用 as.data.frame(x) 转换为数据框,这也可以用于矩阵。示例 1 实时演示x
426 次浏览
创建具有交互作用的回归模型的最简单方法是使用乘法符号 * 输入变量,但这会创建许多其他更高阶的组合。如果我们想创建两个变量组合的交互作用,则可以使用幂运算符,如下面的示例所示。示例 1 实时演示x1