如果 NA 值位于 R 数据框中的不同位置,则无法在基础 R 中轻松删除它们,我们需要一个包来完成此操作。解决此问题的最佳包是 dplyr,我们可以将 dplyr 的 summarise_each 函数与 na.omit 一起使用以删除所有 NA。但是,如果数据框中有多列,则所有列中的非 NA 值的数量必须相同。示例考虑以下数据框:在线演示> x1 x2 df1 df1输出 x1 x2 1 NA 15 2 NA 15 3 NA 15 ... 阅读更多
有时我们想使用 R 中数据框的其他列来更改列或创建新列,这在我们要创建分类列时通常需要,但也可以用于数值列。例如,我们可能想要根据工资创建一个列,如果工资大于另一列中的工资,则添加这些工资,否则取两者的差值。这将有助于我们了解两列中的工资是否相等、小于或大于。在 R 中,我们可以使用 transform ... 阅读更多
当我们使用 ggplot2 包创建水平条形图时,分类变量的标签与轴的右侧对齐,如果这些标签的大小不同,则看起来有点模糊。因此,我们可能希望将标签的对齐方式设置为左侧,这可以通过使用 ggplot2 包的 theme 函数来完成。示例考虑以下数据框:> df df输出 x y 1 India 14 2 UK 15 3 Russia 12 4 United States of America 18加载 ggplot2 包并创建水平... 阅读更多
如果我们有一个分类变量或组变量,那么我们可能希望为每个类别或级别创建一个折线图,这将有助于我们理解单个图中多个级别的范围。为此,我们可以使用 ggplot2 包的 facet_grid 函数,如下例所示。示例考虑以下数据框:在线演示> x y df df输出 x y 1 C -1.55668689 2 A 2.41399136 3 D -0.78520253 4 A -0.43092594 5 C 1.94379390 6 A ... 阅读更多