902 次浏览
示例可能存在其中一个变量以相反的方式记录,并且我们希望使用该变量创建散点图。因此,我们需要在绘图时反转该变量。假设该变量是自变量,因此它将在 X 轴上绘制。因此,要反转 X 轴标签,我们可以使用 ggplot2 包的 scale_x_reverse 函数。考虑以下数据框 - 示例 实时演示x
7K+ 次浏览
加权平均值是通过找到权重和值的乘积之和,然后将此和除以权重总和来确定的平均值。如果权重成比例,则权重总和应为 1。在基础 R 中,我们有一个函数 weighted.mean 用于查找加权平均值,我们只需要传递值向量和权重向量即可。示例 实时演示x1
535 次浏览
当我们创建绘图并在其上方添加标题时,标题的默认对齐方式为左对齐,位于绘图区域的边缘。但有时,我们希望在 Y 轴标签的上方显示标题,因此,我们可以使用 theme 函数并相应地设置 hjust 参数。示例考虑以下数据框 - 实时演示x
428 次浏览
如果我们有组变量的汇总数据,那么我们可能希望直观地查看误差或说均值和标准差之间的差异,因此,我们可以创建一个带有标准差误差线的条形图。这可以通过使用 ggplot2 包的 geom_errorbar 函数来完成。示例考虑以下数据框 - 实时演示组
413 次浏览
当我们绘制散点图时,可能有一些关键点我们希望显示,因此我们根据我们的目标创建垂直或水平线。这些垂直或水平线可以通过使用 ggplot2 的 geom_vline 或 geom_hline 函数绘制,但要添加一些值,我们可以使用 geom_text 函数。示例考虑以下数据框 - 实时演示> x y df df输出 x y 1 1.2474363 -0.15892165 2 1.7511870 -1.18938250 3 -1.3001612 -0.32313571 4 -1.4220049 1.52915756 5 0.4355646 0.18282983 6 0.3128323 0.16467130 7 1.5099580 1.15199751 8 -0.4907705 -1.98635182 9 -1.4249190 ... 阅读更多
2K+ 次浏览
通常,条形图是在 Y 轴上以任何方式创建频率或计数,无论它是手动还是使用任何软件或编程语言,但有时我们希望使用百分比。这可以通过在 R 中使用 scales 包来完成,它为我们提供了 labels=percent_format() 选项来将标签更改为百分比。示例考虑以下数据框 - 实时演示> x df df输出 x 1 2 2 3 3 3 4 1 5 2 6 4 7 4 8 4 9 2 10 3 11 3 12 4 13 3 14 4 15 4 16 1 17 3 ... 阅读更多
9K+ 次浏览
要替换 R 向量中的值,我们可以使用 replace 函数。最好将替换保存到一个新对象中,即使您将该新对象命名为与原始对象相同,否则替换将无法在进一步的分析中使用。正如您在对象 x5(在示例中)中看到的,当我们将 5 替换为 3 时,-1 替换为 0 的先前替换返回为原始向量中的值。因此,我们应该将其保存在一个新对象中。示例 实时演示> x1 x1输出[1] 1 2 3 4 5 6 7 8 9 10 > replace(x1, x1==5, 10)输出[1] 1 2 3 ... 阅读更多
3K+ 次浏览
在进行数据分析时,我们经常需要处理因子数据,并且我们可能希望找到因子水平和其他变量组合的频率或计数。这有助于我们在因子水平内部和之间进行比较。因此,我们可以添加一个新列作为计数来查找所需的频率,这可以通过使用 dplyr 包的 group_by 和 mutate 函数来完成。示例考虑以下数据框 - 实时演示> Group Rating df head(df, 20)输出 Group Rating 1 A 1 2 B 6 3 C 2 ... 阅读更多
1K+ 次浏览
累积和通常用于显示值的运行总计,这些总计也有助于我们识别总计。通过这种方式,我们可以分析运行总计随时间的变化。要创建 Y 轴上显示计数的累积和图表,我们可以使用 ggplot2 包的 stat_bin 函数。示例考虑以下数据框 - 实时演示> x df head(df, 20)输出 x 1 1.755900133 2 1.185746239 3 0.821489888 4 1.358420721 5 2.719636441 6 2.885153151 7 1.131452570 8 0.302981998 9 0.433865254 10 2.373338327 11 0.428436149 12 1.835789725 13 2.600838211 14 2.108302471 15 1.164818373 16 1.547473189 ... 阅读更多
通常,我们在 R 中获得的数据框和矩阵包含缺失值,如果我们想为这些数据框和矩阵找到相关矩阵,我们会卡住。这几乎发生在每个数据分析人员身上,但我们可以通过在使用 cor 函数计算相关矩阵时使用 na.omit 来解决此问题。查看下面的示例以了解这一点。示例考虑以下数据框 - 实时演示> x1 x2 x3 x4 df head(df, 20)输出 x1 x2 x3 x4 1 2 2.6347839 4 2.577690 2 3 0.3082031 1 6.250998 3 1 0.3082031 3 7.786711 4 ... 阅读更多