找到 34423 篇文章,关于编程

如何在 R 数据框列中确定具有最小值和最大值的行列?

Nizamuddin Siddiqui
更新于 2020年9月9日 08:22:05

1K+ 次浏览

在数据分析中,我们经常需要确定最小值和最大值,因为这些值有助于我们了解所考虑的列或变量的范围。这可以通过使用 `which.max` 查找最大值和 `which.min` 查找最小值,并使用单方括号提取行来实现。示例请参见以下数据框 - 实时演示x1

如何减少使用 grid.arrange 在 R 中连接的两个图之间的间距?

Nizamuddin Siddiqui
更新于 2020年9月9日 08:14:01

2K+ 次浏览

当我们使用 `grid.arrange` 连接或组合图表时,即使两个图表中的自变量相同,第一个图表的刻度也会出现在中间作为 X 轴。因此,我们可能希望在连接时去除图表之间的间距,只保留一个 X 轴。这可以通过使用 `theme` 函数来实现。示例请参见以下数据框 - 实时演示set.seed(123) x

如何创建与使用 R 中的 plot 函数创建的图表的 Y 轴值匹配的网格线?

Nizamuddin Siddiqui
更新于 2020年9月9日 08:09:05

306 次浏览

当我们在 R 中创建图表并绘制网格线时,网格线是根据 `grid` 函数中提供的数值绘制的,因此它可能与 Y 轴标签匹配,也可能不匹配。但是可以做到这一点,我们只需要将 `grid` 函数内的值设置为 NULL。示例请参见以下图表 - 实时演示x

如何在 R 数据框中基于其他变量的条件创建一个具有二元变量的列?

Nizamuddin Siddiqui
更新于 2020年9月9日 08:00:43

8K+ 次浏览

有时我们需要创建额外的变量来添加有关现有数据的更多信息,因为它增加了价值。这在我们进行特征工程时尤其常用。如果我们了解到某些可能会影响我们响应的内容,那么我们更倾向于将其作为变量添加到数据中,因此我们根据现有的数据进行补充。例如,根据其他变量应用条件来创建另一个变量,例如,如果频率与某个标准匹配,则为优良程度创建二元变量。示例请参见以下数据框 - 实时演示set.seed(100) Group

如何在 R 向量中找到所有值的幂?

Nizamuddin Siddiqui
更新于 2020年9月9日 07:49:38

1K+ 次浏览

我们经常需要找到值的幂或 R 向量中所有值的幂,尤其是在处理多项式模型时。这可以通过使用 ^ 符号来实现,就像我们在 Excel 中所做的那样。例如,如果我们有一个向量 x,则 x 中所有值的平方可以表示为 x^2。示例 实时演示x1

如何在 R 中将 X 变量的轴标题位置更改为顶部,将 Y 变量的轴标题位置更改为右侧?

Nizamuddin Siddiqui
更新于 2020年9月9日 07:46:52

240 次浏览

任何软件或编程语言中任何二维图的轴标题的默认位置是 X 轴位于底部,Y 轴位于左侧,但我们可能需要将这些标题的位置分别更改为顶部和右侧。这可以通过使用 ggplot2 包的 `scale_x_continuous(position="top")` 和 `scale_y_continuous(position="right")` 函数来实现。示例请参见以下数据框 - 实时演示set.seed(101) x

如何在 R 中的字符串向量中查找相似的单词?

Nizamuddin Siddiqui
更新于 2020年9月9日 07:43:16

1K+ 次浏览

有时字符串向量中的字符串存在拼写错误,我们希望提取相似的单词以避免拼写错误,因为相似的单词可能代表单词的正确和不正确形式。这可以通过使用 `agrep` 和 `lapply` 函数来实现。示例 1 实时演示x1

如果直方图条高于轴大小,如何在 R 中更改 Y 轴的比例?

Nizamuddin Siddiqui
更新于 2020年9月9日 07:31:33

2K+ 次浏览

当我们使用 R 中的 `hist` 函数创建直方图时,Y 轴标签通常小于直方图的一个或多个条。因此,直方图看起来不太吸引人,并且将 Y 轴值与条形大小匹配变得有些困难。要解决这个问题,我们可以使用 `hist` 函数的 `ylim` 参数,其中可以提供要在 Y 轴标签上绘制的范围。示例请参见以下数据及其直方图 - 实时演示set.seed(101) x

如何在 R 数据框的列中查找非零值的个数?

Nizamuddin Siddiqui
更新于 2020年9月8日 14:57:37

205 次浏览

如果 R 数据框具有数值列,则也可能存在一些或所有列中存在零,我们可能对查找列中非零值的个数感兴趣。这将有助于我们根据非零值的个数比较列,这可以通过使用 `colSums` 来实现。示例请参见以下数据框 - 实时演示x1

如何在执行 Spearman 相关性检验时避免“无法用精确 p 值计算具有相同值的 p 值”的警告?

Nizamuddin Siddiqui
更新于 2020年9月8日 14:45:45

19K+ 次浏览

当变量不是连续的而是可以排序时,我们不使用皮尔逊相关系数来查找线性关系,在这种情况下,斯皮尔曼相关系数就出现了。由于斯皮尔曼相关系数考虑值的秩,因此相关性检验忽略相同的秩来查找 p 值,因此我们得到警告“无法用精确 p 值计算具有相同值的 p 值”。这可以通过在 `cor.test` 函数内使用 `exact = FALSE` 来避免。示例请参见以下向量,并执行斯皮尔曼相关性检验以检查它们之间的关系 - 实时演示x1

广告
© . All rights reserved.