找到 34423 篇文章 相关编程

如何在 R 数据框中将一列从其他位置移动到第一位置?

Nizamuddin Siddiqui
更新于 2020年8月11日 14:31:05

228 次浏览

在 R 数据框中,列的位置至关重要,尤其是在处理大型数据集时。由于第一列最先出现,因此必须使数据框中的列按照有助于我们轻松查看重要列的顺序排列。为此,我们可能需要更改列的位置。要将列的位置更改为第一位置,我们可以使用单个方括号。示例考虑以下数据框 −> set.seed(99) > x1 x2 x3 x4 x5 x6 df df x1 x2 x3 x4 x5 x6 ... 阅读更多

如何从 R 向量中选择随机元素?

Nizamuddin Siddiqui
更新于 2020年8月11日 14:26:06

9K+ 次浏览

从 R 向量中随机选择元素可确保无偏选择,因为在进行随机选择时,向量的每个元素都有相等的被随机选择过程(特别是简单随机抽样选择过程)选中的概率。要从 R 向量中随机选择一个或多个元素,我们可以使用 sample 函数。示例> x1 x1  [1]  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 [26] 26 27 28 29 30 31 32 33 34 35 36 ... 阅读更多

如何在 R 数据框中根据某些条件更改一列?

Nizamuddin Siddiqui
更新于 2020年8月11日 14:07:43

487 次浏览

有时,特定列的列值与另一列存在某种关系,我们可能需要根据某些条件更改该特定列的值。我们需要进行此更改以检查列值的变化如何影响所考虑的两列之间的关系。在 R 中,我们可以使用单个方括号来更改列值。示例考虑以下数据框 −> set.seed(1) > x1 x2 x3 df df x1 x2 x3 1 4 4 4.462839 2 4 1 3.941181 3 ... 阅读更多

如何通过重复行数来增加 R 数据框的长度?

Nizamuddin Siddiqui
更新于 2020年8月11日 13:43:01

508 次浏览

如果我们坚信新的数据收集将产生相同类型的数据,那么我们可能希望在 R 中使用更多行来扩展我们的数据框。虽然不建议这样做,因为由于此过程导致数据失去无偏性,但这样做是为了节省在新的数据收集中投入的时间和金钱。在 R 中,我们可以使用 rep 与 seq_len 函数来重复 R 数据框的行数。示例考虑以下数据框 −> x1 x2 df df x1 x2 1 Fruits 2 2 Vegetables 5 ... 阅读更多

如何查找 R 数据框的分组汇总统计信息?

Nizamuddin Siddiqui
更新于 2020年8月11日 13:37:38

438 次浏览

为了比较不同的组,我们需要每个组的汇总统计信息。它有助于我们观察组之间的差异。汇总统计信息提供了最小值、第一四分位数、中位数、第三四分位数和最大值。因此,我们可以比较各组的这些值。要查找 R 数据框的分组汇总统计信息,我们可以使用 tapply 函数。示例考虑以下数据框 −> set.seed(99) > x1 x2 df head(df, 20) x1 x2 1 48 G1 2 33 G2 3 44 G3 4 22 G4 5 99 G5 6 62 G1 7 ... 阅读更多

如何查找 R 数据框中列值的总和?

Nizamuddin Siddiqui
更新于 2020年8月11日 13:24:05

439 次浏览

R 数据框包含可能表示类似类型变量的列;因此,我们可能希望找到每列值的总和并根据总和进行比较。这可以在 sum 函数的帮助下完成,但首先我们需要提取列才能找到总和。示例考虑以下数据框 −> set.seed(1) > x1 x2 x3 x4 x5 x6 x7 df df x1 x2 x3 x4 x5 x6 x7 1 -0.62645381 1.41897737 0.83547640 3.9016178 1.4313313 1.879633 2.494043 2 0.18364332 1.28213630 0.74663832 1.4607600 1.8648214 2.542116 4.343039 3 ... 阅读更多

如何将 R 数据框中字符串或分类变量的所有单词转换为大写?

Nizamuddin Siddiqui
更新于 2020年8月11日 13:19:16

257 次浏览

大多数情况下,我们获得的数据格式并非我们想要的,因此我们需要根据我们的需要进行更改。当分类变量的水平用单词而不是数字表示时,我们可以将这些水平转换为小写或大写。有时,这样做只是为了使信息看起来更友好。通常,我们会发现值是小写的,因此我们可以使用 sapply 函数将其转换为大写。示例考虑以下数据框 −> x1 x2 x3 df df   x1 x2 ... 阅读更多

如何使用 dplyr 在 R 数据框中选择具有变量的分组最小值或最大值的行?

Nizamuddin Siddiqui
更新于 2020年8月11日 13:15:01

1K+ 次浏览

如果 R 数据框包含一个具有许多组级别的组变量,那么根据组级别查找离散或连续变量的最小值和最大值就会变得困难。但这可以使用 dplyr 包中的 slice 函数来完成。考虑以下数据框,它包含一个组变量以及连续变量和离散变量 −> set.seed(2) > x1 x2 x3 x4 x5 x6 x7 Group df df x1 x2 x3 x4 x5 x6 x7 Group 1 85 8 14 7 8 2.900301 749 1 2 79 7 12 4 3 3.331022 200 2 ... 阅读更多

如何在 R 中将数据框随机拆分为多个部分?

Nizamuddin Siddiqui
更新于 2020年8月11日 13:01:29

2K+ 次浏览

当数据框很大时,我们可以将其随机拆分为多个部分。当我们想部分分析数据时,这可能需要。我们可以借助 split 函数和 sample 函数来随机选择值。示例考虑基本 R 中的 trees 数据 −> str(trees) 'data.frame': 31 obs. of 3 variables: $ Girth : num 8.3 8.6 8.8 10.5 10.7 10.8 11 11 11.1 11.2 ... $ Height: num 70 65 63 72 81 83 66 75 80 75 ... $ Volume: num 10.3 10.3 10.2 16.4 18.8 19.7 15.6 18.2 22.6 19.9 ... 阅读更多

如何在 R 数据框中将空值转换为 NA?

Nizamuddin Siddiqui
更新于 2020年8月11日 12:58:17

580 次浏览

当我们的数据包含空值时,很难执行分析,我们可能需要将这些空值转换为 NA,以便我们可以了解不可用的值的数量。这可以通过使用单个方括号来完成。示例考虑以下数据框,其中包含一些空值 −> x1 x2 x3 df df x1 x2 x3 1 1 2 5 2 2 2 5 3 3 2 4 4 1 2 4 5 2 4 4 6 3 4 4 7 1 4 4 8 2 4 2 9 3 2 10 1 2 11 2 12 3 13 1 4 14 2 4 15 3 4 16 4 17 18 19 2 20 1将空值转换为 NA −> df[df == ""] df x1 x2 x3 1 1 2 5 2 2 2 5 3 3 2 4 4 1 2 4 5 2 4 4 6 3 4 4 7 1 4 4 8 2 4 2 9 3 2 10 1 2 11 2 12 3 13 1 4 14 2 4 15 3 4 16 4 17 18 19 2 20 1

广告

© . All rights reserved.