710 次查看
要在 R 数据框中查找按组的正数和负数个数,我们可以使用 dplyr 包的 mutate 函数。例如,如果我们有一个名为 df 的数据框,其中包含一列分类列 x 和一列数值列 y,则可以使用以下命令查找分类列的正数和负数个数:df%>%group_by(x)%>%mutate(positive=sum(y>0),negative=sum(y
887 次查看
要创建仅包含交互项的线性模型,我们可以在创建模型时使用交互变量。例如,如果我们有一个名为 df 的数据框,其中包含两个自变量 V1 和 V2 以及一个因变量 Y,则仅包含交互项的线性模型可以创建为 lm(Y~V1:V2,data=df)。考虑以下数据框:示例 实时演示x1
219 次查看
要在基础 R 绘图中创建垂直箭头,我们可以使用 arrows 函数。arrows 函数有五个参数将用于创建垂直箭头。前四个值定义箭头的位,最后一个参数 xpd 允许 R 创建箭头。查看以下示例以了解其工作原理。示例plot(1:10) arrows(1,-1,1,0,xpd=TRUE)输出示例plot(1:10) arrows(1,-1,1,2,xpd=TRUE)输出示例plot(1:10) arrows(2,-1,2,2,xpd=TRUE)输出
1K+ 次查看
当我们使用 ggplot2 创建直方图时,我们需要传递我们想要在直方图中具有的箱数,并根据这些箱数创建直方图,这些箱数实际上是我们将在直方图中具有的条数。要以不同的颜色填充这些条,我们需要使用 fill 参数并传递与箱数相等的数值范围,如下例所示。考虑以下数据框:x
4K+ 次查看
要在使用 ggplot2 创建的直方图中显示均值,我们可以使用 geom_vline 函数,我们需要将 x 截距值定义为我们要为其创建直方图的列的均值。此外,我们可以使用 geom_vline 函数内的 size 参数更改直方图中均值线的粗细。考虑以下数据框:x
573 次查看
默认情况下,条形之间的间距相等,与图中条形的数量无关。如果我们想要条形之间有不同的间距,则需要在 barplot 函数内使用 space 参数,但第一个值不会产生影响,因为第一个间距在 Y 轴和第一个条形之间是固定的。例如,如果我们有一个包含三个值的向量 x,则可以使用以下命令创建条形之间间距不同的条形图:barplot(x,space=c(0.5,0.1,0.5))示例 实时演示x
3K+ 次查看
残差是实际值和预测值之间的差,预测值是线性模型根据实际值预测的值。要从线性模型中提取残差和预测值,我们需要使用 resid 和 predict 函数以及模型对象。考虑以下数据框:示例 实时演示x1
2K+ 次查看
qq 图是分位数的图,有助于了解提供的数据是否来自指定的分布,大多数情况下用于检查数据是否服从正态分布。如果我们想要创建带有置信区间的 qq 图,则可以使用 car 包的 qqPlot 函数,如下例所示。考虑以下数据框:示例 实时演示x
779 次查看
如果我们在 R 数据框的多个列中散布着值,则我们需要将它们组合并创建一个单列,此组合过程称为连接。当数据格式不佳以加载到 R 中时,值的大多数散布情况就会发生。因此,为了处理此散布问题,我们需要使用 apply 函数。考虑以下数据框:示例 实时演示x1
大多数情况下,日期数据仅以日期格式提供,并且没有关于年份季度的信息。当我们想要比较季度或进行一些时间序列分析时,需要年份的季度。可以使用 zoo 包中的 as.yearqtr 函数将日期转换为季度和年份,如下例所示。示例library(zoo) as.yearqtr("2021-01-19", format="%Y-%m-%d")输出[1] "2021 Q1"as.yearqtr("2021-04-19", format="%Y-%m-%d")[1] "2021 Q2"as.yearqtr(c("2021-04-19", "2020-05-24", "2020-11-09"), format="%Y-%m-%d")[1] "2021 Q2" "2020 Q2" "2020 Q4" 示例 实时演示x1阅读更多