902 次浏览
示例:可能存在一个变量以相反的方式记录,而我们希望使用该变量创建散点图。因此,我们需要在绘图时反转该变量。假设该变量是自变量,因此它将绘制在 X 轴上。因此,为了反转 X 轴标签,我们可以使用 ggplot2 包的 scale_x_reverse 函数。考虑下面的数据框 - 示例 在线演示
7K+ 次浏览
加权平均值是通过找到权重和值的乘积之和,然后将此和除以权重总和来确定的平均值。如果权重成比例,则权重总和应为 1。在基础 R 中,我们有一个函数 weighted.mean 用于查找加权平均值,我们只需要传递值向量和权重向量即可。示例 在线演示
535 次浏览
当我们创建绘图并在其上方放置标题时,标题的默认对齐方式为左对齐,位于绘图区域的边缘。但有时,我们希望将标题显示在 Y 轴标签的上方,因此,我们可以使用 theme 函数并相应地设置 hjust 参数。示例 考虑下面的数据框 - 在线演示
428 次浏览
如果我们有分组变量的汇总数据,我们可能希望直观地查看误差或均值和标准差之间的差异,因此,我们可以使用标准差误差线创建条形图。这可以通过使用 ggplot2 包的 geom_errorbar 函数来完成。示例 考虑下面的数据框 - 在线演示 分组
413 次浏览
当我们绘制散点图时,可能有一些关键点我们希望显示,因此我们根据我们的目标创建垂直线或水平线。这些垂直线或水平线可以使用 ggplot2 的 geom_vline 或 geom_hline 函数绘制,但要添加一些值,我们可以使用 geom_text 函数。示例 考虑下面的数据框 - 在线演示 > x y df df 输出 x y 1 1.2474363 -0.15892165 2 1.7511870 -1.18938250 3 -1.3001612 -0.32313571 4 -1.4220049 1.52915756 5 0.4355646 0.18282983 6 0.3128323 0.16467130 7 1.5099580 1.15199751 8 -0.4907705 -1.98635182 9 -1.4249190 ... 阅读更多
2K+ 次浏览
大多数情况下,条形图是用频率或计数在 Y 轴上创建的,无论它是手动创建的还是使用任何软件或编程语言创建的,但有时我们希望使用百分比。这可以通过在 R 中使用 scales 包来完成,该包为我们提供了 labels=percent_format() 选项来将标签更改为百分比。示例 考虑下面的数据框 - 在线演示 > x df df 输出 x 1 2 2 3 3 3 4 1 5 2 6 4 7 4 8 4 9 2 10 3 11 3 12 4 13 3 14 4 15 4 16 1 17 3 ... 阅读更多
9K+ 次浏览
要在 R 向量中替换一个值,我们可以使用 replace 函数。最好将替换保存到一个新对象中,即使你将该新对象命名为与原始对象相同,否则替换将无法用于进一步分析。正如你可以在对象 x5(在示例中)中看到的,当我们将 5 替换为 3 时,-1 的先前替换为 0 返回到原始向量中。因此,我们应该将其保存在一个新对象中。示例 在线演示 > x1 x1 输出 [1] 1 2 3 4 5 6 7 8 9 10 > replace(x1, x1==5, 10) 输出 [1] 1 2 3 ... 阅读更多
3K+ 次浏览
在进行数据分析时,我们经常必须处理因子数据,并且我们可能希望找到因子水平和其他变量组合的频率或计数。这有助于我们在因子水平内和之间进行比较。因此,我们可以添加一个新的计数列来查找所需的频率,这可以通过使用 dplyr 包的 group_by 和 mutate 函数来完成。示例 考虑下面的数据框 - 在线演示 > Group Rating df head(df, 20) 输出 Group Rating 1 A 1 2 B 6 3 C 2 ... 阅读更多
1K+ 次浏览
累积和通常用于显示值的运行总计,这些总计也有助于我们确定总计。通过这种方式,我们可以分析运行总计随时间的变化。为了创建 Y 轴上带有计数的累积和图表,我们可以使用 ggplot2 包的 stat_bin 函数。示例 考虑下面的数据框 - 在线演示 > x df head(df, 20) 输出 x 1 1.755900133 2 1.185746239 3 0.821489888 4 1.358420721 5 2.719636441 6 2.885153151 7 1.131452570 8 0.302981998 9 0.433865254 10 2.373338327 11 0.428436149 12 1.835789725 13 2.600838211 14 2.108302471 15 1.164818373 16 1.547473189 ... 阅读更多
在 R 中,数据框和矩阵中经常出现缺失值,如果我们想为这些数据框和矩阵找到相关矩阵,我们会卡住。这几乎发生在每个数据分析人员身上,但我们可以通过在使用 cor 函数计算相关矩阵时使用 na.omit 来解决这个问题。查看下面的示例。示例 考虑下面的数据框 - 在线演示 > x1 x2 x3 x4 df head(df, 20) 输出 x1 x2 x3 x4 1 2 2.6347839 4 2.577690 2 3 0.3082031 1 6.250998 3 1 0.3082031 3 7.786711 4 ... 阅读更多