428 次浏览
如果我们有分组变量的汇总数据,我们可能希望直观地查看误差或说均值和标准差之间的差异,因此,我们可以创建一个带有标准差误差线的条形图。这可以通过使用 ggplot2 包的 geom_errorbar 函数来实现。示例请考虑以下数据框 - 实时演示组
413 次浏览
当我们绘制散点图时,可能有一些关键点我们希望显示,因此我们根据我们的目标创建垂直或水平线。这些垂直或水平线可以通过使用 ggplot2 的 geom_vline 或 geom_hline 函数绘制,但要添加一些值,我们可以使用 geom_text 函数。示例请考虑以下数据框 - 实时演示> x y df df输出 x y 1 1.2474363 -0.15892165 2 1.7511870 -1.18938250 3 -1.3001612 -0.32313571 4 -1.4220049 1.52915756 5 0.4355646 0.18282983 6 0.3128323 0.16467130 7 1.5099580 1.15199751 8 -0.4907705 -1.98635182 9 -1.4249190 ... 阅读更多
2K+ 次浏览
通常,条形图是在 Y 轴上以任何方式创建频率或计数,无论是手动还是使用任何软件或编程语言,但有时我们希望使用百分比。这可以通过在 R 中使用 scales 包来完成,它为我们提供了 labels=percent_format() 选项来将标签更改为百分比。示例请考虑以下数据框 - 实时演示> x df df输出 x 1 2 2 3 3 3 4 1 5 2 6 4 7 4 8 4 9 2 10 3 11 3 12 4 13 3 14 4 15 4 16 1 17 3 ... 阅读更多
9K+ 次浏览
要替换 R 向量中的值,我们可以使用 replace 函数。最好将替换保存到一个新的对象中,即使您将该新对象命名为与原始对象相同,否则替换将无法在进一步的分析中发挥作用。正如您在对象 x5(在示例中)中看到的,当我们将 5 替换为 3 时,-1 替换为 0 的先前替换返回为原始向量中的值。因此,我们应该将其保存在一个新的对象中。示例实时演示> x1 x1输出[1] 1 2 3 4 5 6 7 8 9 10 > replace(x1, x1==5, 10)输出[1] 1 2 3 ... 阅读更多
3K+ 次浏览
在进行数据分析时,我们经常需要处理因子数据,并且我们可能希望找到因子水平和其他变量组合的频率或计数。这有助于我们在因子水平内和之间进行比较。因此,我们可以添加一个新的计数列来查找所需的频率,这可以通过使用 dplyr 包的 group_by 和 mutate 函数来完成。示例请考虑以下数据框 - 实时演示> Group Rating df head(df, 20)输出 Group Rating 1 A 1 2 B 6 3 C 2 ... 阅读更多
1K+ 次浏览
累积和通常用于显示值的运行总计,这些总计还有助于我们识别总体总计。通过这种方式,我们可以分析运行总计随时间的变化。要创建在 Y 轴上显示计数的累积和图表,我们可以使用 ggplot2 包的 stat_bin 函数。示例请考虑以下数据框 - 实时演示> x df head(df, 20)输出 x 1 1.755900133 2 1.185746239 3 0.821489888 4 1.358420721 5 2.719636441 6 2.885153151 7 1.131452570 8 0.302981998 9 0.433865254 10 2.373338327 11 0.428436149 12 1.835789725 13 2.600838211 14 2.108302471 15 1.164818373 16 1.547473189 ... 阅读更多
通常,我们在 R 中获得的数据框和矩阵具有缺失值,如果我们想为这些数据框和矩阵找到相关矩阵,我们会卡住。这几乎发生在每个数据分析人员身上,但我们可以通过在使用 cor 函数计算相关矩阵时使用 na.omit 来解决此问题。查看下面的示例。示例请考虑以下数据框 - 实时演示> x1 x2 x3 x4 df head(df, 20)输出 x1 x2 x3 x4 1 2 2.6347839 4 2.577690 2 3 0.3082031 1 6.250998 3 1 0.3082031 3 7.786711 4 ... 阅读更多
当我们使用 ggplot2 创建箱线图时,箱线图中线条的默认宽度非常细,我们可能希望增加该宽度以使箱线图边缘的可见性更清晰。这将帮助观众一目了然地理解箱线图的边缘。我们可以通过使用 ggplto2 包的 geom_boxplot 函数的 lwd 参数来做到这一点。示例请考虑以下数据框 - 实时演示> ID Count df head(df, 20)输出 ID Count 1 S1 20 2 S2 14 3 S3 17 4 S4 30 5 S1 17 6 S2 23 7 S3 ... 阅读更多
218 次浏览
当我们在 R 向量中具有重复元素并且向量大小很大时,我们可能想知道该向量中的不同值。这将帮助我们了解向量中拥有的唯一值,以便我们可以创建适当的图表并使用该向量执行适当的分析。这可以通过将 length 函数与 unique 一起使用来完成。示例实时演示> x1 x1输出[1] 2 5 5 3 2 4 3 3 1 4 5 4 5 3 3 1 1 2 5 1 3 2 4 1 3 1 5 4 2 5 ... 阅读更多
要查找矩阵中值的行列索引,我们不能简单地使用 which 函数,因为它根据矩阵中数字的顺序返回索引。例如,如果我们有一个如下所示的矩阵 M -1 2 3 4 1 6 7 8 1现在,如果我们尝试使用 which(M==1) 查找索引,它将返回 1 5 9因为 1 位于 1、5 和 9 处。因此,我们需要使用 arr.ind = TRUE,以便 which 函数可以将矩阵读取为数组。示例请考虑以下矩阵 - 实时演示> ... 阅读更多