找到 34423 篇文章 编程

如何在 R 数据框列中确定具有最小值和最大值的行?

Nizamuddin Siddiqui
更新于 2020-09-09 08:22:05

1K+ 浏览量

在数据分析中,我们经常需要确定最小值和最大值,因为这些值有助于我们了解所考虑的列或变量的限制。这可以通过使用 which.max 用于最大值和 which.min 用于最小值以及单个方括号来提取行来完成。示例考虑以下数据框 - 实时演示x1

如何在 R 中使用 grid.arrange 连接的两个图之间减少间距?

Nizamuddin Siddiqui
更新于 2020-09-09 08:14:01

2K+ 浏览量

当我们使用 grid.arrange 连接或组合图时,第一个图的刻度会出现在中间作为 X 轴,即使两个图中的自变量相同。因此,我们可能希望在连接时移除图之间的间距,以获得唯一的 X 轴。这可以通过使用 theme 函数来完成。示例考虑以下数据框 - 实时演示set.seed(123) x

如何在 R 中使用 plot 函数创建的图中创建与 Y 轴值匹配的网格线?

Nizamuddin Siddiqui
更新于 2020-09-09 08:09:05

306 浏览量

当我们在 R 中创建图并绘制网格线时,网格线是在 grid 函数内提供的数值基础上绘制的,因此它可能与 Y 轴标签匹配也可能不匹配。但这是可以实现的,我们只需要将 grid 函数内的数值设置为 NULL。示例考虑以下图 - 实时演示x

如何在 R 数据框中基于其他变量的条件创建具有二进制变量的列?

Nizamuddin Siddiqui
更新于 2020-09-09 08:00:43

8K+ 浏览量

有时我们需要创建额外的变量来添加有关现有数据的更多信息,因为它增加了价值。这在我们进行特征工程时尤其有用。如果我们了解到某些可能会影响我们响应的事物,那么我们更倾向于将其作为数据中的变量使用,因此我们根据我们现有的数据进行补充。例如,根据其他变量应用条件创建另一个变量,例如,如果频率匹配某个标准,则为优良创建二进制变量。示例考虑以下数据框 - 实时演示set.seed(100) Group

如何在 R 向量中找到所有值的幂?

Nizamuddin Siddiqui
更新于 2020-09-09 07:49:38

1K+ 浏览量

通常,我们需要找到某个值的幂或 R 向量中所有值的幂,尤其是在处理多项式模型时。这可以通过使用 ^ 符号来完成,就像我们在 Excel 中一样。例如,如果我们有一个向量 x,则 x 中所有值的平方可以表示为 x^2。示例实时演示x1

如何在 R 中将轴标题的位置更改为 X 变量的顶部和 Y 变量的右侧?

Nizamuddin Siddiqui
更新于 2020-09-09 07:46:52

240 浏览量

任何软件或编程语言中任何二维图形的轴标题的默认位置是 X 轴的底部和 Y 轴的左侧,但我们可能需要将这些标题的位置分别更改为顶部和右侧。这可以通过使用 ggplot2 包的 scale_x_continuous(position="top") 和 scale_y_continuous(position="right") 函数来完成。示例考虑以下数据框 - 实时演示set.seed(101) x

如何在 R 中查找字符串向量中相似的单词?

Nizamuddin Siddiqui
更新于 2020-09-09 07:43:16

1K+ 浏览量

有时字符串向量中的字符串存在拼写错误,我们希望提取相似的单词以避免拼写错误,因为相似的单词可能代表单词的正确和不正确形式。这可以通过使用 agrep 和 lapply 函数来完成。示例 1实时演示x1

如果直方图条形图高于 R 中轴的大小,如何更改 Y 轴的比例?

Nizamuddin Siddiqui
更新于 2020-09-09 07:31:33

2K+ 浏览量

当我们使用 R 中的 hist 函数创建直方图时,Y 轴标签通常小于直方图的一个或多个条形图。因此,直方图看起来不太美观,并且将 Y 轴值与条形图大小匹配变得有点困难。为了解决此问题,我们可以在 hist 函数中使用 ylim 参数,其中可以提供要在 Y 轴标签上绘制的范围。示例考虑以下数据及其直方图 - 实时演示set.seed(101) x

如何在 R 数据框的列中查找不为零的值的数量?

Nizamuddin Siddiqui
更新于 2020-09-08 14:57:37

205 浏览量

如果 R 数据框具有数值列,则某些或所有列中也可能存在零,我们可能希望查找列中非零值的个数。这将有助于我们根据非零值的个数比较列,并且可以通过使用 colSums 来完成。示例考虑以下数据框 - 实时演示x1

如何在执行 R 中 Spearman 相关性的相关性检验时避免警告“无法计算具有重复值的精确 p 值”?

Nizamuddin Siddiqui
更新于 2020-09-08 14:45:45

19K+ 浏览量

当变量不是连续的但可以排序时,我们不使用皮尔逊相关系数来查找线性关系,在这种情况下,斯皮尔曼相关系数就出现了。由于斯皮尔曼相关系数考虑了值的秩,因此相关性检验忽略了相同的秩以查找 p 值,因此我们得到了警告“无法计算具有重复值的精确 p 值”。这可以通过在 cor.test 函数内部使用 exact = FALSE 来避免。示例考虑以下向量并执行斯皮尔曼相关性检验以检查它们之间的关系 - 实时演示x1

广告

© . All rights reserved.