找到 34423 篇文章,关于编程

如何在 R 数据框中通过排除特定文本值来对数据框进行子集化?

Nizamuddin Siddiqui
更新于 2020 年 11 月 6 日 13:02:02

706 次浏览

要根据文本值创建子集,我们可以使用 rowSums 函数,通过将文本的总和定义为零,这将帮助我们删除包含该特定文本值的所有行。例如,如果我们有一个包含许多列中 A 的数据框 df,则可以将排除 A 的 df 的所有行选择为 -df[rowSums(df=="A")==0,,drop=FALSE]示例实时演示请考虑以下数据框 -set.seed(951) x1

如何在 R 中使用 ggplot2 创建的绘图中使用框突出显示文本?

Nizamuddin Siddiqui
更新于 2020 年 11 月 6 日 12:56:07

208 次浏览

可能有很多方法可以在绘图中突出显示文本,但最简单的方法是使用 ggplot2 包的 geom_label 函数,借助此函数,我们可以使用一行代码放置所需的文本和该文本的美学效果。强烈建议我们应该使用具有所需规范的 geom_label 函数。示例实时演示请考虑以下数据框 -set.seed(222) x

如何在 R 中从混淆矩阵计算灵敏度和特异性?

Nizamuddin Siddiqui
更新于 2020 年 11 月 6 日 12:48:06

2K+ 次浏览

如果我们有一个混淆矩阵,则可以使用 caret 包的 confusionMatrix 函数计算灵敏度和特异性。例如,如果我们有一个名为 table 的列联表,则可以使用代码 confusionMatrix(table)。这将返回灵敏度和特异性以及许多其他指标。示例 1实时演示> x1 y1 table1 table1输出y1 x1 a b c d a 0 0 1 0 b 0 1 2 1 c 2 2 0 2 d 3 2 1 3加载 caret 包:> library(caret)查找 table1 的灵敏度和特异性:> confusionMatrix(table1)混淆矩阵和统计数据输出y1 x1 a b c ... 阅读更多

如何在基本 R 中使用数据集创建列联表?

Nizamuddin Siddiqui
更新于 2020 年 11 月 6 日 12:45:58

247 次浏览

列联表是一个类似于矩阵的交叉表。这些表可以具有不同数量的列和行,也可以具有相同数量的列和行。如果我们想使用基本 R 中的数据集创建列联表,则可以使用 table 函数。例如,如果我们想为 mtcars 数据的 cyl 和 gear 列创建列联表,则可以按照以下示例 1 中所示进行操作。示例 1实时演示> head(mtcars)输出mpg cyl disp hp drat wt qsec vs am gear carb Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4 Mazda ... 阅读更多

如何在包含不同位置的 NA 的 R 数据框中删除 NA?

Nizamuddin Siddiqui
更新于 2020 年 11 月 6 日 12:23:26

235 次浏览

如果 NA 值位于 R 数据框的不同位置,则无法在基本 R 中轻松删除它们,我们需要一个包来实现。解决此问题的最佳包是 dplyr,我们可以使用 dplyr 的 summarise_each 函数以及 na.omit 来删除所有 NA。但是,如果数据框中有多列,则所有列中的非 NA 值的数量必须相同。示例请考虑以下数据框:实时演示> x1 x2 df1 df1输出 x1 x2 1 NA 15 2 NA 15 3 NA 15 ... 阅读更多

如何检查 R 数据框中是否存在某个值?

Nizamuddin Siddiqui
更新于 2020 年 11 月 6 日 12:13:04

8K+ 次浏览

在数据分析中,有很多小目标有助于我们实现更大的目标。其中一个小目标是检查数据集中是否存在某个值。在 R 中,我们有许多用于数据集的对象,例如数据框、矩阵、data.table 对象等。如果我们想检查 R 数据框中是否存在某个值,则可以使用任何函数。示例请考虑以下数据框:实时演示> set.seed(3654) > x1 x2 x3 x4 df1 df1输出 x1 x2 x3 x4 1 4 5 16 2 2 5 4 ... 阅读更多

如何在 R 中使用 ggplot2 创建带 3 西格玛限值的折线图?

Nizamuddin Siddiqui
更新于 2020 年 11 月 6 日 12:09:17

248 次浏览

要使用 ggplot2 创建带 3 西格玛限值的折线图,我们首先需要计算限值,然后才能创建图表。我们可以为此目的使用 ggplot2 的 geom_ribbon 函数,在其中我们可以将下限 3 西格玛限值传递给 aes 的 ymin 参数,并将上限 3 西格玛限值传递给 aes 的 ymin 参数,我们还需要指定 alpha,以便区分线条和限值的颜色。示例请考虑以下数据框:实时演示> set.seed(14) > x y df df输出 x y 1 1 0.6690751 2 2 1.8594771 3 ... 阅读更多

如何在 R 数据框中基于另一列的某些条件创建新列?

Nizamuddin Siddiqui
更新于 2020 年 11 月 6 日 12:04:50

2K+ 次浏览

有时我们想在 R 中使用数据框的其他列来更改列或创建新列,这在我们要创建分类列时最常需要,但也可以用于数值列。例如,我们可能希望基于薪水创建一列,如果薪水大于另一列中的薪水,则添加这些薪水,否则取它们之间的差值。这将有助于我们了解两列中的薪水是否相等、小于或大于。在 R 中,我们可以使用 transform ... 阅读更多

如何在 R 中将水平条形图中标签的对齐方式设置为左侧?

Nizamuddin Siddiqui
更新于 2020 年 11 月 6 日 12:00:15

1K+ 次浏览

当我们使用 ggplot2 包创建水平条形图时,分类变量的标签会对齐到轴的右侧,如果这些标签的大小不同,则看起来有点模棱两可。因此,我们可能希望将标签的对齐方式设置为左侧,这可以通过使用 ggplot2 包的 theme 函数来完成。示例请考虑以下数据框:> df df输出    x y 1 India  14 2 UK     15 3 Russia 12 4 United States of America 18加载 ggplot2 包并创建水平 ... 阅读更多

如何在 R 中绘制圆形?

Nizamuddin Siddiqui
更新于 2020 年 11 月 6 日 11:56:43

4K+ 次浏览

R 中没有直接绘制圆形的函数,但我们可以为此目的使用 plotrix 包。plotrix 包有一个名为 draw.cirlce 的函数,可用于绘制圆形,但我们首先需要在基本 R 中绘制一个绘图,然后在 draw.circle 中传递正确的参数。draw.circle 的第一个和第二个参数分别采用 x 和 y 坐标,第三个参数用于半径,因此应根据基本 R 中的图表正确选择这些参数。加载 plotrix 包:> library(plotrix)使用 draw.circle 创建不同的圆形:示例实时演示> plot(1:10, type="n") > ... 阅读更多

广告

© . All rights reserved.