找到 2038 篇文章 关于 R 编程

如何在基础 R 中按均值排序创建箱线图?

Nizamuddin Siddiqui
更新于 2020-12-08 06:35:20

84 次浏览

要在基础 R 中按均值排序创建箱线图,我们首先需要根据数值列的均值对分类列进行排序,然后创建箱线图。例如,如果我们有一个包含分类列 x 和数值列 y 的数据框 df,那么可以使用 df$x 创建按均值排序的箱线图。

如何在 R 数据框中基于字符串匹配查找字符串列的列号?

Nizamuddin Siddiqui
更新于 2020-12-08 06:32:00

339 次浏览

数据框可能非常长,并且包含仅包含字符串值的列以及数值值。在进行分析时,我们可能需要检查哪些列包含特定的字符串值。例如,如果我们有一列字符串值为 A、B 和 C,并且我们想检查哪个列包含值“A”,那么可以使用 apply 函数,如下面的示例所示。示例考虑以下数据框 - 实时演示 x1

如何在 R 数据框中根据两列分类列查找数值列的均值?

Nizamuddin Siddiqui
更新于 2020-12-08 06:28:16

954 次浏览

如果我们在 R 数据框中拥有两列分类列和一列数值列,那么我们可以使用 aggregate 函数的组合根据分类列的组合查找数值列的均值。例如,如果数据框 df 包含数值列 X 和两个分类列 C1 和 C2,那么可以使用以下命令查找 X 的均值,这些均值对应于 C1 和 C2 的组合:aggregate(X~C1+C2,data=df,FUN="mean") 示例考虑以下数据框 - C1

如何在基础 R 中向模型添加变量?

Nizamuddin Siddiqui
更新于 2020-12-07 06:25:50

873 次浏览

如果我们想在基础 R 中向模型添加变量,可以使用 update 函数。update 函数将通过添加新变量来更新之前的模型,这个变量可以是单个变量,也可以是两个或多个变量的交互作用,也可以是现有变量的任何可能的变换。示例考虑以下数据框 - 实时演示 x1

如何在 R 向量中查找 95% 所有值的范围?

Nizamuddin Siddiqui
更新于 2020-12-07 06:21:52

1K+ 次浏览

95% 所有值的范围实际上代表中间 95% 的值。因此,我们可以找到第 2.5 个百分位数和第 97.5 个百分位数,以便获得中间 95% 的范围。为此,我们可以在 R 中使用 quantile 函数。要查找第 2.5 个百分位数,我们需要使用概率 = 0.025;对于第 97.5 个百分位数,我们可以使用概率 = 0.0975。示例实时演示 x1

如何在 R 向量中将序列中的 NA 转换为单个 NA?

Nizamuddin Siddiqui
更新于 2020-12-07 06:19:31

85 次浏览

有时值在一个序列中缺失,R 程序将其记录为 NA(不可用)。在这种情况下,我们可能希望将连续的 NA 记录替换为单个 NA 值。这可以通过使用 is.na 和 diff 函数来完成,如下面的示例所示。示例实时演示 x1

如何在基础 R 中创建并排直方图?

Nizamuddin Siddiqui
更新于 2020-12-07 06:17:24

2K+ 次浏览

要在基础 R 中创建并排直方图,我们首先需要使用 hist 函数创建直方图,并使用 xlim 参数定义更大的 X 轴限制。之后,我们可以创建另一个具有更大均值和更小标准差的直方图,以便条形图不会相互冲突,并且必须在第二个 hist 函数中添加 add=T 参数。示例实时演示 hist(rnorm(5000,mean=5,sd=2.1),col="green",xlim=c(1,20)) 输出示例 hist(rnorm(5000,mean=15,sd=1.25),col="red",add=T) 输出

如何识别 R 矩阵列中的重复值?

Nizamuddin Siddiqui
更新于 2020-12-07 06:15:50

378 次浏览

我们可以使用 duplicated 函数轻松识别矩阵中的重复值,但它不会指定第一次出现的值也是重复的。因此,我们需要将其与 OR 符号 | 和 duplicated 函数的 fromLast = TRUE 参数一起使用,以便将重复值的第一次出现也标识为重复。示例实时演示 M1

如何比较 R 数据框中两列的精确匹配?

Nizamuddin Siddiqui
更新于 2020-12-07 06:12:05

7K+ 次浏览

有时分析需要用户检查 R 数据框中两列的值是否完全相同,这有助于分析非常大的数据框,如果我们怀疑两列中的比较值。

如何在 R 中使用 ggplot2 创建具有回归线且截距为 0 且斜率等于 1 的散点图?

Nizamuddin Siddiqui
更新于 2020-12-07 06:08:44

262 次浏览

要使用 ggplot2 创建截距为 0 且斜率等于 1 的回归线,我们可以使用 geom_abline 函数,但我们需要为 x 轴和 y 轴值传递适当的限制。例如,如果我们在数据框 df 中有两列 x 和 y,并且两列的范围都从 -1 到 1 开始,那么可以创建具有回归线(截距为 0,斜率等于 1)的散点图,如下所示:ggplot(df,aes(x,y))+geom_point()+geom_abline()+lims(x=c(-1,1),y=c(-1,1)) 示例考虑以下数据框 - 实时演示 x

广告