找到 34423 篇文章 关于编程

如何在 R 数据框中通过排除特定文本值来筛选数据框?

Nizamuddin Siddiqui
更新于 2020年11月6日 13:02:02

706 次浏览

要根据文本值创建子集,我们可以使用 rowSums 函数,将文本等于零的和定义为零,这将有助于我们删除包含该特定文本值的所有行。例如,如果我们有一个包含 A 的多个列的数据框 df,那么可以按以下方式选择排除 A 的所有 df 行:-df[rowSums(df=="A")==0,,drop=FALSE]示例 实时演示考虑以下数据框:-set.seed(951) x1

如何在 R 中使用 ggplot2 创建的绘图中使用框突出显示文本?

Nizamuddin Siddiqui
更新于 2020年11月6日 12:56:07

208 次浏览

可能有很多方法可以突出显示绘图内的文本,但最简单的方法是使用 ggplot2 包的 geom_label 函数,借助此函数,我们可以使用一行代码放置所需的文本和该文本的美学效果。强烈建议我们应使用带有所需规范的 geom_label 函数。示例 实时演示考虑以下数据框:-set.seed(222) x

如何在 R 中根据混淆矩阵计算敏感性和特异性?

Nizamuddin Siddiqui
更新于 2020年11月6日 12:48:06

2K+ 次浏览

如果我们有一个混淆矩阵,那么可以使用 caret 包的 confusionMatrix 函数来计算敏感性和特异性。例如,如果我们有一个名为 table 的列联表,那么我们可以使用代码 confusionMatrix(table)。这将返回敏感性和特异性以及许多其他指标。示例 1实时演示> x1 y1 table1 table1输出y1 x1 a b c d a 0 0 1 0 b 0 1 2 1 c 2 2 0 2 d 3 2 1 3加载 caret 包:> library(caret)查找 table1 的敏感性和特异性:> confusionMatrix(table1)混淆矩阵和统计量输出y1 x1 a b c ... 阅读更多

如何在基本 R 中使用数据集创建列联表?

Nizamuddin Siddiqui
更新于 2020年11月6日 12:45:58

247 次浏览

列联表是一个类似于矩阵的交叉表。这些表可以具有不同数量或相等数量的列和行。如果我们想在基本 R 中使用数据集创建列联表,则可以使用 table 函数。例如,如果我们想为 mtcars 数据的 cyl 和 gear 列创建列联表,则可以按示例 1 中所示进行操作。示例 1实时演示> head(mtcars)输出mpg cyl disp hp drat wt qsec vs am gear carb Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4 Mazda ... 阅读更多

如何在包含 NA 的不同位置的 R 数据框中删除 NA?

Nizamuddin Siddiqui
更新于 2020年11月6日 12:23:26

235 次浏览

如果 NA 值位于 R 数据框的不同位置,则无法在基本 R 中轻松删除它们,我们需要一个包来解决此问题。解决此问题的最佳包是 dplyr,我们可以将 dplyr 的 summarise_each 函数与 na.omit 一起使用以删除所有 NA。但是,如果数据框中有多列,则所有列中的非 NA 值的数量必须相同。示例考虑以下数据框:实时演示> x1 x2 df1 df1输出 x1 x2 1 NA 15 2 NA 15 3 NA 15 ... 阅读更多

如何检查值是否存在于 R 数据框中?

Nizamuddin Siddiqui
更新于 2020年11月6日 12:13:04

8K+ 次浏览

有很多小的目标有助于我们在数据分析中实现更大的目标。其中一个小的目标是检查值是否存在于数据集中。在 R 中,我们有很多用于数据集的对象,例如数据框、矩阵、data.table 对象等。如果我们想检查值是否存在于 R 数据框中,则可以使用任何函数。示例考虑以下数据框:实时演示> set.seed(3654) > x1 x2 x3 x4 df1 df1输出 x1 x2 x3 x4 1 4 5 16 2 2 5 4 ... 阅读更多

如何在 R 中使用 ggplot2 创建带有 3 西格玛限值的折线图?

Nizamuddin Siddiqui
更新于 2020年11月6日 12:09:17

248 次浏览

要使用 ggplot2 创建带有 3 西格玛限值的折线图,我们首先需要计算限值,然后才能创建图表。我们可以为此目的使用 ggplot2 的 geom_ribbon 函数,其中我们可以为 aes 中的 ymin 参数传递下限 3 西格玛限值,为 aes 中的 ymin 参数传递上限 3 西格玛限值,还需要指定 alpha,以便区分线条和限值的颜色。示例考虑以下数据框:实时演示> set.seed(14) > x y df df输出 x y 1 1 0.6690751 2 2 1.8594771 3 ... 阅读更多

如何在 R 数据框中基于另一列的某些条件创建新列?

Nizamuddin Siddiqui
更新于 2020年11月6日 12:04:50

2K+ 次浏览

有时我们希望通过使用 R 中数据框的其他列来更改列或创建新列,这在我们需要创建分类列时通常是必需的,但也可以用于数值列。例如,我们可能希望根据薪资创建一个列,如果薪资大于另一列中的薪资,则添加这些薪资,否则取两者的差值。这将有助于我们了解两列中的薪资是否相等、更低或更高。在 R 中,我们可以使用 transform ... 阅读更多

如何在 R 中将水平条形图中标签的对齐方式设置为左侧?

Nizamuddin Siddiqui
更新于 2020年11月6日 12:00:15

1K+ 次浏览

当我们使用 ggplot2 包创建水平条形图时,分类变量的标签与轴的右侧对齐,如果这些标签的大小不同,则看起来有点模糊。因此,我们可能希望将标签的对齐方式设置为左侧,这可以通过使用 ggplot2 包的 theme 函数来实现。示例考虑以下数据框:> df df输出    x y 1 India  14 2 UK     15 3 Russia 12 4 United States of America 18加载 ggplot2 包并创建水平 ... 阅读更多

如何在 R 中绘制圆形?

Nizamuddin Siddiqui
更新于 2020年11月6日 11:56:43

4K+ 次浏览

R 中没有直接绘制圆形的函数,但我们可以为此目的使用 plotrix 包。plotrix 包有一个名为 draw.cirlce 的函数,可用于绘制圆形,但我们首先需要在基本 R 中绘制一个绘图,然后在 draw.circle 中传递正确的参数。draw.circle 的第一个和第二个参数分别采用 x 和 y 坐标,第三个参数用于半径,因此应根据基本 R 中的图表正确选择这些参数。加载 plotrix 包:> library(plotrix)使用 draw.circle 创建不同的圆形:示例实时演示> plot(1:10, type="n") > ... 阅读更多

广告

© . All rights reserved.