找到 34423 篇文章,关于编程

如何在 R 数据框中的一列中查找唯一值?

Nizamuddin Siddiqui
更新于 2020年8月11日 08:48:12

11K+ 次浏览

分类变量有多个类别,但如果数据集很大,类别数量也很多,那么识别它们就有点困难。因此,我们可以提取分类变量的唯一值,这将帮助我们轻松识别分类变量的类别。我们可以使用每个 R 数据框列的 unique 函数来实现。示例考虑以下数据框 −> x1 x2 x3 x4 df df    x1 x2  x3     x4 1  A  5 印度     a 2  A  5 印度     b 3  A ... 阅读更多

如何在 R 数据框中提取两个或多个变量的唯一组合?

Nizamuddin Siddiqui
更新于 2020年8月11日 08:41:56

9K+ 次浏览

R 数据框可以包含大量分类变量,这些分类变量形成不同的组合。例如,一个变量的一个值可以与另一个变量的两个或多个值关联。此外,一个分类变量可以具有所有唯一类别。我们可以找到尽可能多的变量的这种唯一组合,并且可以使用 unique 函数来完成。示例考虑以下数据框 −> x1 x2 x3 x4 df df x1 x2 x3 x4 1 1 A a 5 2 2 A b 5 3 3 A c 10 ... 阅读更多

如何在 R 中创建一个一列或多列为列表的数据框?

Nizamuddin Siddiqui
更新于 2020年8月11日 08:37:40

90 次浏览

创建一个包含列表作为列的数据框并不困难,但我们需要使用 I 与列表一起使用,以便列表元素不会作为单个列工作。在这里,您将找到创建列表的常用方法,如果我们想将该列表插入我们的数据中,则此方法不正确,正确的使用方法在最后提到。不正确的方法 −示例> x1 x2 df df      x1 c.1..1. c.2..2. c.3..3. c.4..4. c.5..5. c.6..6. c.7..7. c.8..8. c.9..9. 1     1    1       2       3 ... 阅读更多

如何在 R 中使用 ggplot2 创建没有水平网格线和 Y 轴标签的条形图?

Nizamuddin Siddiqui
更新于 2020年8月11日 08:12:38

351 次浏览

使用 ggplot2 的 ggplot 函数绘制的条形图显示水平和垂直网格线。如果我们只对条形高度感兴趣,那么我们可能更喜欢删除水平网格线。这样,我们可以拥有 X 轴,它可以帮助我们查看我们感兴趣的变量中不同的类别,并摆脱不必要的信息。这可以通过在 scale_y_discrete 函数中将 breaks 参数设置为 NULL 来完成。示例考虑以下数据框 −> x y df library(ggplot2)创建带有所有网格线的图 −> ggplot(df, aes(x, y))+ + geom_bar(stat='identity')输出创建没有水平网格线的图 ... 阅读更多

如何在 R 中将数据框转换为 data.table?

Nizamuddin Siddiqui
更新于 2020年8月11日 08:10:10

1K+ 次浏览

由于使用 data.table 的操作有时比数据框更快,因此我们可能希望将数据框转换为 data.table 对象。数据框和 data.table 之间的区别在于数据框在基本 R 中可用,但要使用 data.table,我们必须安装 data.table 包。我们可以使用 data.table 包中的 setDT 函数来实现。示例考虑以下数据框 −> set.seed(1) > x1 x2 x3 x4 x5 df df x1 x2 x3 x4 x5 1  -0.1264538 1.7189774 2 6 9.959193 2   0.6836433  1.5821363 3 4 7.477968 3  -0.3356286 ... 阅读更多

如何在 R 中使用 plot 函数更改坐标轴标签?

Nizamuddin Siddiqui
更新于 2020年8月11日 08:03:29

257 次浏览

在图表中,坐标轴标签帮助我们了解创建图表的变量的范围。在 R 中使用 plot 函数创建图表时,坐标轴标签会自动选择,但我们可以更改它们。为此,首先我们必须删除坐标轴,然后添加我们想要的标签的每个坐标轴,然后创建图表的框。示例考虑以下数据 −> x y plot(x, y)输出更改 X 和 Y 坐标轴的坐标轴标签 −> plot(x, y, axes=FALSE)+ + axis(side = 1, at = c(2, 5, 10))+ + ... 阅读更多

如何在 R 中根据名称获取行索引或列索引?

Nizamuddin Siddiqui
更新于 2020年8月11日 08:00:43

681 次浏览

在分析过程中,我们可能更喜欢使用行索引或列索引而不是使用它们的数字,因此,我们可以使用 grep 函数来获取它们。在处理大型数据集时,它变得很有帮助,因为大型数据集具有大量的行和列,因此更容易用它们的索引而不是数字来回忆它们。具体来说,需要列索引,另一方面,只有在特殊情况下才需要行,例如分析特定案例。示例考虑以下数据框 −> set.seed(1) > x1 x2 x3 x4 x5 df head(df, 20) ... 阅读更多

如何在 R 中使用 ggplot2 更改条形图中的 Y 轴值?

Nizamuddin Siddiqui
更新于 2020年8月11日 07:49:09

6K+ 次浏览

条形图经常用于分析因子变量的水平在数据集中出现的次数,Y 轴值对条形图至关重要。有时这些值不是我们想要的形式,因此,我们想用新的值替换它们。这可以使用 ggplot2 中 scale_y_continuous 函数的 breaks 参数来完成。示例考虑以下数据框 −> set.seed(1) > x df library(ggplot2)创建未指定 Y 轴值的图 −> ggplot(df, aes(x))+ + geom_bar()输出使用新的 Y 轴值绘图 −> ggplot(df, aes(x))+ + geom_bar()+ + scale_y_continuous(breaks=c(0, 2, ... 阅读更多

如何在 R 中从字符串中提取初始字符、最后一个字符或中间字符?

Nizamuddin Siddiqui
更新于 2020年8月11日 07:46:59

1K+ 次浏览

在文本分析中,我们可能希望从单个字符串或字符串向量中提取字符。此提取可能需要创建包含某些特定单词的新字符串,这些单词需要进行进一步分析。我们可以使用 stringr 包的 str_sub 函数来实现。示例考虑以下字符串 −> x1 library(stringr) > str_sub(x1, 1, 8) [1] "Removing" > str_sub(x1, 1, 23) [1] "Removing harmful things" > str_sub(x1, 29, 37) [1] " the road" > str_sub(x1, 30, 37) [1] "the road" > str_sub(x1, -58, -51) [1] "Removing" > str_sub(x1, -58, -1) [1] "Removing harmful things from ... 阅读更多

如何在 R 中计算分类变量组合的行数?

Nizamuddin Siddiqui
更新于 2020年8月11日 07:36:38

415 次浏览

当我们有两个分类变量时,它们中的每一个都可能对另一个变量具有不同数量的行。这有助于我们了解这两个分类变量的组合值。我们可以使用 dplyr 包的 count 函数找到此类行。示例考虑基本 R 中的 CO2 数据 −> head(CO2, 20) > head(CO2, 20)       Plant    Type    Treatment    conc     uptake 1     Qn1     Quebec   nonchilled     95      16.0 2     Qn1     Quebec   nonchilled     175   ... 阅读更多

广告
© . All rights reserved.