找到 2038 篇文章,关于 R 编程

如何在 R 中使用 plot 函数更改坐标轴标签?

Nizamuddin Siddiqui
更新于 2020年8月11日 08:03:29

257 次浏览

在图表中,坐标轴标签有助于我们了解创建图表的变量范围。在使用 plot 函数在 R 中创建图表时,坐标轴标签会自动选择,但我们可以更改它们。为此,首先我们必须删除坐标轴,然后添加每个带有我们想要的标签的坐标轴,然后创建图表的边框。示例考虑以下数据 -> x y plot(x, y)输出更改 X 和 Y 坐标轴的坐标轴标签 -> plot(x, y, axes=FALSE)+ + axis(side = 1, at = c(2, 5, 10))+ + ... 阅读更多

如何在 R 中根据名称获取行索引或列索引?

Nizamuddin Siddiqui
更新于 2020年8月11日 08:00:43

681 次浏览

在分析过程中,我们可能更喜欢使用行索引或列索引而不是使用它们的数字,因此,我们可以借助 grep 函数获取它们。在处理大型数据集时,它变得很有用,因为大型数据集具有大量行和列,因此使用它们的索引而不是数字更容易记住它们。具体来说,需要列索引,另一方面,行仅在特殊情况下需要,例如分析特定情况。示例考虑以下数据框 -> set.seed(1) > x1 x2 x3 x4 x5 df head(df, 20) ... 阅读更多

如何在 R 中使用 ggplot2 更改条形图中的 Y 轴值?

Nizamuddin Siddiqui
更新于 2020年8月11日 07:49:09

6K+ 次浏览

条形图经常用于分析因子变量的水平在数据集中出现的次数,并且 Y 轴值对条形图至关重要。有时这些值不是我们想要的格式,因此,我们希望用新的值替换它们。这可以通过 ggplot2 中 scale_y_continuous 函数的 breaks 参数来实现。示例考虑以下数据框 -> set.seed(1) > x df library(ggplot2)创建图表而不指定 Y 轴值 -> ggplot(df, aes(x))+ + geom_bar()输出使用新的 Y 轴值绘图 -> ggplot(df, aes(x))+ + geom_bar()+ + scale_y_continuous(breaks=c(0, 2, ... 阅读更多

如何在 R 中从字符串中提取初始、最后或中间字符?

Nizamuddin Siddiqui
更新于 2020年8月11日 07:46:59

1K+ 次浏览

在文本分析中,我们可能希望从单个字符串或字符串向量中提取字符。此提取可能需要创建包含一些特定单词的新字符串,这些单词需要进行进一步分析。我们可以借助 stringr 包的 str_sub 函数来实现。示例考虑以下字符串 -> x1 library(stringr) > str_sub(x1, 1, 8) [1] "Removing" > str_sub(x1, 1, 23) [1] "Removing harmful things" > str_sub(x1, 29, 37) [1] " the road" > str_sub(x1, 30, 37) [1] "the road" > str_sub(x1, -58, -51) [1] "Removing" > str_sub(x1, -58, -1) [1] "Removing harmful things from ... 阅读更多

如何在 R 中计算分类变量组合的行数?

Nizamuddin Siddiqui
更新于 2020年8月11日 07:36:38

415 次浏览

当我们有两个分类变量时,每个变量对于另一个变量都可能具有不同数量的行。这有助于我们了解这两个分类变量的组合值。我们可以使用 dplyr 包的 count 函数找到此类行。示例考虑 base R 中的 CO2 数据 -> head(CO2, 20) > head(CO2, 20)       Plant    Type    Treatment    conc     uptake 1     Qn1     Quebec   nonchilled     95      16.0 2     Qn1     Quebec   nonchilled    175   ... 阅读更多

如何在 R 中随机化已创建的向量?

Nizamuddin Siddiqui
更新于 2020年8月11日 07:17:01

715 次浏览

一些向量是在 R 中随机创建的,而一些向量不是随机创建的,但我们可以对这两种类型的向量进行随机化。随机化确保无偏性,因此在创建向量具有改变分析结果的趋势的目标时,它是必要的。R 中的随机化可以通过 sample 函数轻松完成。未随机创建的向量的随机化 -> x1 x1 [1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 ... 阅读更多

如何在 R 中创建具有重复值的向量?

Nizamuddin Siddiqui
更新于 2023年9月14日 22:00:00

32K+ 次浏览

在 R 中创建具有重复值的向量有两种方法,但它们都有不同的方法,第一种是通过重复向量的每个元素,第二种是通过指定次数重复元素。这两种方法都使用 rep 函数来创建向量。示例考虑以下示例 -> x1 x1 [1] 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 [39] 4 ... 阅读更多

如何在 R 数据框中将 NA 替换为所选列的值?

Nizamuddin Siddiqui
更新于 2020年8月11日 06:49:34

588 次浏览

在数据分析中,在数据框中找到一些 NA 值非常普遍,但如果包含 NA 值的列对分析没有用,则所有 NA 值都不会造成问题。我们可以将所有 NA 值替换为 0 或任何其他值,以用于有用的列。示例考虑以下数据框 -> set.seed(99) > x1 x2 x3 x4 x5 df df   x1   x2   x3   x4    x5 1  NA   NA   25    NA 2  5     2   24    f    2 3  NA   ... 阅读更多

如何在 R 中计算字符串中的单词数?

Nizamuddin Siddiqui
更新于 2020年8月11日 06:29:10

483 次浏览

句子中的单词数可用于文本分析,因此,我们需要对其进行计数。这可以针对单个句子或多个句子。我们可以使用 strsplit 和 sapply 查找句子或多个句子中的单词数。示例考虑以下作为向量读取的句子 -> x1 x1 [1] "Data Science is actually the Statistical analysis" > sapply(strsplit(x1, " "), length) [1] 7 > x2 x2 [1] "China faced trouble even after controlling COVID-19" > sapply(strsplit(x2, " "), length) [1] 7 > x3 x3 [1] "Corona virus has changed everything ... 阅读更多

如何在 R 中使用 ggplot2 更改绘图区域边距?

Nizamuddin Siddiqui
更新于 2020年8月11日 06:25:51

1K+ 次浏览

在使用 ggplot2 创建图表时,绘图区域为正方形,但我们可以通过在 theme 函数中设置 plot.margin 来更改绘图区域。当我们想要减小绘图区域以及数据点较少时,这很有用。示例考虑以下数据框 -> set.seed(1) > x y df library(ggplot2)创建散点图而不更改绘图区域边距 -> ggplot(df,aes(x,y))+ + geom_point()> ggplot(df,aes(x,y))+ + geom_point()+ + theme(plot.margin = unit(c(1,1,1,1), "cm"))> ggplot(df,aes(x,y))+ + geom_point()+ + theme(plot.margin = unit(c(2,2,2,2), "cm"))

广告