找到 2038 篇文章 关于 R 编程

如何在 R 中用 NA 或其他值替换用空格记录的缺失值?

Nizamuddin Siddiqui
更新于 2020-08-10 14:49:40

1K+ 阅读量

有时当我们在 R 中读取数据时,缺失值被记录为空格,并且很难用任何值替换它们。其背后的原因是我们需要知道在缺失值的位置使用了多少个空格。如果我们知道这一点,那么分配任何值就变得很容易。示例考虑以下向量 x 和 y 的数据框。> x y df df x y 1 1 2 3 2 3 2 4 1 43 5 2 2 6 3 7 2 3 ... 阅读更多

如何使用数据框的所有变量在 R 中找到相关矩阵?

Nizamuddin Siddiqui
更新于 2020-08-10 14:42:15

681 阅读量

相关矩阵帮助我们一次确定多个变量之间线性关系的方向和强度。因此,很容易决定哪些变量应该用于线性模型,哪些变量可以删除。我们可以通过简单地使用带有数据框名称的 cor 函数来找到相关矩阵。示例考虑以下连续变量的数据框 - > set.seed(9) > x1 x2 x3 x4 x5 df df x1 x2 ... 阅读更多

如何在 R 数据框中更改列的顺序?

Nizamuddin Siddiqui
更新于 2020-08-10 14:32:20

674 阅读量

当我们想要操作数据时,可能需要对列进行排序。操作可能有多种原因,例如交叉验证、可视化等。当我们在原始数据中更改任何内容时,我们也应该小心,因为这可能会影响我们的处理。要更改列的顺序,我们可以使用单个方括号。示例考虑以下数据框 - > set.seed(1) > Class Grade Score df df   Class Grade Score 1   a     A     68 2   b     B     39 3   c     C      1 4   ... 阅读更多

如何在 R 中使用 ggplot2 创建带有图表副标题的条形图?

Nizamuddin Siddiqui
更新于 2020-08-10 14:21:44

145 阅读量

有多种方法可以表达任何图表。我们在图表中提供的信息越多越好,因为一张图片胜过千言万语。由于没有人喜欢阅读冗长的报告,因此我们应该对图表进行更好的报告。因此,我们可以在 ggplot2 中添加图表标题以及图表副标题来帮助读者。示例考虑以下数据 - > set.seed(1) > x table(x) x 2 3 4 5 6 7 8 9 11 1 3 4 2 4 2 2 1 1 > df library(ggplot2)创建简单的条形图 - > ggplot(df, aes(x))+ + geom_bar()输出创建... 阅读更多

如何在 R 中通过一系列次数或固定次数创建具有重复行的 数据框?

Nizamuddin Siddiqui
更新于 2020-08-10 14:18:16

935 阅读量

有时需要数据框中的重复行,主要用于扩展数据大小而不是收集原始数据。这节省了我们的时间,但肯定会有偏差,不建议这样做。即使不建议这样做,但有时也变得必要,例如,如果无法收集原始数据,那么我们可以这样做。如果我们这样做,那么我们必须在我们的分析报告中指定它。在 R 中,我们可以使用 rep 函数以及 seq_len 和 nrows 来创建具有重复行的 数据框。示例考虑... 阅读更多

如何使用 dplyr 在 R 数据框中为每个组创建最大值的数据框?

Nizamuddin Siddiqui
更新于 2020-08-10 14:06:37

404 阅读量

在进行数据分析时,有时需要对分组最大值进行子集化,并且该数据框的子集用于比较分析。主要目标是将这些最大值彼此之间或与阈值进行比较。在 R 中,我们可以使用 dplyr 包中的 group_by 和 slice 函数找到分组的最大值。示例考虑以下数据框 - > x y df head(df, 20) x y 1 S1 1 2 S1 2 3 S1 3 4 S1 4 5 ... 阅读更多

如何在 R 中使用 ggplot2 时处理警告“删除了包含缺失值的 n 行”?

Nizamuddin Siddiqui
更新于 2020-08-10 12:16:43

18K+ 阅读量

当我们错误地指定 X 轴或 Y 轴的值范围时,会出现警告“删除了包含缺失值的 n 行”。我们可以使用 scale_x_continuous(limits=c(?, ?)) 对 x 轴和 scale_y_continuous(limits=c(?, ?)) 对 y 轴在 ggplot 函数中指定此范围。如果范围大于实际数据范围,则不会出现警告,否则,我们将收到有关缺失值数量的警告。示例考虑以下数据框 - > set.seed(2) > x y df library(ggplot2)创建 Y 轴限制从 0 到 5 的图形 - > ggplot(df, aes(x, y))+ + geom_point()+ + scale_y_continuous(limits=c(0, 5)) 警告消息:... 阅读更多

如何在 R 中使用 plot 函数将散点图上的点与平滑线连接起来?

Nizamuddin Siddiqui
更新于 2020-08-10 14:04:45

268 阅读量

如果散布度很高,那么将散点图上的点与平滑线连接起来非常困难,但我们可能希望查看无法仅通过查看点来理解的平滑度。这也有助于了解模型是否为线性模型。我们可以通过使用 plot 函数绘制带有 loess 的模型来做到这一点。示例考虑以下数据 - > set.seed(3) > x y 模型 summary(Model) 调用:loess(公式 = y ~ x) 观察次数:10 等效参数数:4.77 残差标准误差:8.608 平滑矩阵的迹:5.27(精确)控制... 阅读更多

如何在 R 中找到均值的标准误差?

Nizamuddin Siddiqui
更新于 2020-08-10 14:03:41

1K+ 阅读量

均值的标准误差是标准差除以样本大小的平方根。找到均值标准误差的最简单方法是使用公式找到其值。示例 > set.seed(1)我们将使用相同的公式为正态随机变量、从 1 到 100 的数字序列、随机样本、二项式随机变量和均匀随机变量找到标准误差。最后,我将确认我们是否对我们在这里考虑的所有类型的变量都使用了正确的方法。> x x [1] -0.6264538 0.1836433 -0.8356286 ... 阅读更多

如何在 R 中找到矩阵的逆?

Nizamuddin Siddiqui
更新于 2020-08-10 14:02:10

7K+ 阅读量

矩阵的逆可以在 R 中借助 solve 函数计算,大多数情况下,不经常使用 R 的人会错误地为此目的使用 inv 函数,但在基本 R 中没有名为 inv 的函数来查找矩阵的逆。示例考虑以下矩阵及其逆 - > M1 M1 M1    [, 1] [, 2] [1, ] 1 3 [2, ] 2 4 > solve(M1) [, 1] [, 2] [1, ] -2 1.5 [2, ] 1 -0.5 > M2 M2 ... 阅读更多

广告