找到 2038 篇文章 关于 R 编程

如何在 R 中将用空格记录的缺失值替换为 NA 或任何其他值?

Nizamuddin Siddiqui
更新于 2020 年 8 月 10 日 14:49:40

1K+ 次查看

有时,当我们在 R 中读取数据时,缺失值会被记录为空格,并且难以用任何值替换它们。其背后的原因是我们需要知道在缺失值的位置使用了多少个空格。如果我们知道这一点,则分配任何值就变得容易了。示例考虑以下向量 x 和 y 的数据框。> x y df df x y 1 1 2 3 2 3 2 4 1 43 5 2 2 6 3 7 2 3 ... 阅读更多

如何使用数据框的所有变量在 R 中找到相关矩阵?

Nizamuddin Siddiqui
更新于 2020 年 8 月 10 日 14:42:15

681 次查看

相关矩阵有助于我们一次确定多个变量之间线性关系的方向和强度。因此,很容易确定哪些变量应该用于线性模型,哪些变量可以删除。我们可以通过简单地使用 cor 函数和数据框名称来找到相关矩阵。示例考虑以下连续变量的数据框 -> set.seed(9) > x1 x2 x3 x4 x5 df df x1 x2 ... 阅读更多

如何在 R 数据框中更改列的顺序?

Nizamuddin Siddiqui
更新于 2020 年 8 月 10 日 14:32:20

674 次查看

当我们想要操作数据时,可能需要对列进行排序。操作可能有多个原因,例如交叉验证、可视化等。我们还应该在更改原始数据中的任何内容时小心,因为这可能会影响我们的处理。要更改列的顺序,我们可以使用单个方括号。示例考虑以下数据框 -> set.seed(1) > Class Grade Score df df   Class Grade Score 1   a     A     68 2   b     B     39 3   c     C      1 4   ... 阅读更多

如何在 R 中使用 ggplot2 创建带图表副标题的条形图?

Nizamuddin Siddiqui
更新于 2020 年 8 月 10 日 14:21:44

145 次查看

有多种方法可以表达任何图表。我们可以在图表中提供的信息越多越好,因为一张图片胜过千言万语。由于没有人喜欢阅读冗长的报告,因此我们应该对图表进行更好的报告。因此,我们可以在 ggplot2 中添加图表标题和图表副标题来帮助读者。示例考虑以下数据 -> set.seed(1) > x table(x) x 2 3 4 5 6 7 8 9 11 1 3 4 2 4 2 2 1 1 > df library(ggplot2)创建简单的条形图 -> ggplot(df, aes(x))+ + geom_bar()输出创建 ... 阅读更多

如何在 R 中通过一系列次数或通过固定次数创建具有重复行的数框?

Nizamuddin Siddiqui
更新于 2020 年 8 月 10 日 14:18:16

935 次查看

有时需要数据框中的重复行,主要用于扩展数据大小,而不是收集原始数据。这节省了我们的时间,但肯定会有一些偏差,这是不建议的。即使不建议这样做,但有时它也变得必要,例如,如果无法收集原始数据,那么我们可以这样做。如果我们这样做,那么我们必须在我们的分析报告中指定它。在 R 中,我们可以使用 rep 函数与 seq_len 和 nrows 来创建具有重复行的数框。示例考虑 ... 阅读更多

如何使用 dplyr 在 R 数据框中为每个组创建最大值的数框?

Nizamuddin Siddiqui
更新于 2020 年 8 月 10 日 14:06:37

404 次查看

在进行数据分析时,有时需要对分组最大值进行子集化,并且此数据框子集用于比较分析。主要目标是将这些最大值彼此之间或与阈值进行比较。在 R 中,我们可以使用 dplyr 包中的 group_by 和 slice 函数找到分组最大值。示例考虑以下数据框 -> x y df head(df, 20) x y 1 S1 1 2 S1 2 3 S1 3 4 S1 4 5 ... 阅读更多

如何在 R 中使用 ggplot2 时处理警告“已删除包含缺失值的 n 行”?

Nizamuddin Siddiqui
更新于 2020 年 8 月 10 日 12:16:43

18K+ 次查看

当我们错误地指定 X 轴或 Y 轴的值范围时,会出现警告“已删除包含缺失值的 n 行”。我们可以使用 scale_x_continuous(limits=c(?, ?)) 为 x 轴和 scale_y_continuous(limits=c(?, ?)) 为 y 轴在 ggplot 函数中指定此范围。如果范围大于实际数据范围,则不会出现警告,否则,我们将收到有关缺失值数量的警告。示例考虑以下数据框 -> set.seed(2) > x y df library(ggplot2)创建 Y 轴限制范围为 0 到 5 的绘图 -> ggplot(df, aes(x, y))+ + geom_point()+ + scale_y_continuous(limits=c(0, 5)) 警告消息: ... 阅读更多

如何在 R 中使用 plot 函数将散点图上的点与平滑线连接?

Nizamuddin Siddiqui
更新于 2020 年 8 月 10 日 14:04:45

268 次查看

如果分散度很高,则很难将散点图上的点与平滑线连接起来,但我们可能希望查看无法仅通过查看点来理解的平滑度。它还有助于了解模型是否为线性模型。我们可以通过使用 plot 函数绘制带有 loess 的模型来做到这一点。示例考虑以下数据 -> set.seed(3) > x y 模型摘要(模型)调用:loess(公式 = y ~ x)观察次数:10 等效参数数:4.77 残差标准误差:8.608 平滑矩阵的迹:5.27(精确)控制 ... 阅读更多

如何在 R 中找到均值的标准误差?

Nizamuddin Siddiqui
更新于 2020 年 8 月 10 日 14:03:41

1K+ 次查看

均值的标准误差是标准差除以样本大小的平方根。找到均值标准误差的最简单方法是使用公式来查找其值。示例> set.seed(1)我们将使用相同的公式为正态随机变量、从 1 到 100 的数字序列、随机样本、二项式随机变量和均匀随机变量找到标准误差。最后,我将确认我们是否对我们在这里考虑的所有类型的变量都使用了正确的方法。> x x [1] -0.6264538 0.1836433 -0.8356286 ... 阅读更多

如何在 R 中找到矩阵的逆?

Nizamuddin Siddiqui
更新于 2020 年 8 月 10 日 14:02:10

7K+ 次查看

矩阵的逆可以在 R 中使用 solve 函数计算,大多数情况下,不经常使用 R 的人会错误地将 inv 函数用于此目的,但在基础 R 中没有名为 inv 的函数来查找矩阵的逆。示例考虑以下矩阵及其逆 -> M1 M1 M1    [, 1] [, 2] [1, ] 1 3 [2, ] 2 4 > solve(M1) [, 1] [, 2] [1, ] -2 1.5 [2, ] 1 -0.5 > M2 M2 ... 阅读更多

广告