903 次浏览
我们可以使用 cbind 按列连接向量,无论这些向量长度是否相同。如果向量长度相同,则会打印两个向量的所有值,但如果向量长度不同,则较短向量的值会被重复。但我们可能不希望重复较短向量的值/元素,可以通过将较短向量的长度设置为较长向量的长度来实现,这将在较短向量中创建 NA 值,在… 阅读更多
780 次浏览
通常,我们按列合并数据框,因为列名在数据集中被认为是主要的,但也可以使用行合并两个数据框。与按列合并相比,按行合并可能会导致更多未清理的数据。这可以通过 merge 函数及其 by 参数来实现。示例考虑以下数据框 - df1
407 次浏览
我们经常在 R 中创建数据的子集,以便根据数据分析项目中整个目标的较小目标执行计算。有时,此子集取决于字符串而不是数值。我们还可以使用 grep 函数,根据列中行值的子字符串创建 data.table 的子集。示例考虑以下 data.table 对象 - x1
1K+ 次浏览
我们可以使用 par(mfrow) 在 R 中的单个绘图窗口中创建多个绘图。这些绘图可能是不同的,也可能是相同的。无论绘图类型如何,我们都可以为所有绘图提供一个公共标题。这可能是一种情况,例如,我们希望显示一些变量的散点图和直方图,但我们的分析目标是固定的。要在绘图窗口中的绘图之间编写公共标题,我们可以使用 mtext 并通过更改 line 参数来调整标题位置。示例 set.seed(100) x1
2K+ 次浏览
有时我们想从一个大字符串中提取一个子字符串,并且该子字符串位于特定字符之后。例如,一个字符串可能是“Learning.Computer.Science.is.not.difficult-Author”,我们想从中提取单词 Author。这可以通过 gsub 函数来实现。示例 x1
我们知道因子变量有很多水平,但我们现有的因子水平可能不是我们需要的形式。例如,如果我们想将大写字母作为因子水平,但原始数据使用英文小写字母。在这种情况下,我们可以使用 dplyr 包的 mutate 函数重命名这些因子水平。示例考虑以下数据框 - City
925 次浏览
我们知道因子变量有很多水平,但我们现有的因子水平可能不是我们需要的形式。例如,如果我们想将大写字母作为因子水平,但原始数据使用英文小写字母。在这种情况下,我们可以使用 dplyr 包的 mutate 函数转换这些因子水平。示例考虑以下数据框 - x
通常,当我们将新列添加到现有的 R 数据框时,该列会添加到列的末尾,但我们可能需要将其放在前面。这完全取决于我们的易用性、对变量的熟悉程度及其需求。我们可以使用 cbind 函数在现有 R 数据框的前面添加新列。示例考虑以下数据框 - ID
3K+ 次浏览
矩阵只包含数值,有时这些值输入错误,或者我们可能想根据某些条件替换矩阵中的某些值。例如,如果矩阵中有一些 5,我们可能想将所有 5 替换为大于 5 或小于 5 的另一个数字。示例考虑以下矩阵 - set.seed(123) M
282 次浏览
通常,我们从 R 数据框中将列提取为向量,但有时我们可能需要将列作为数据框,因此,我们可以使用 as.data.frame 提取我们想作为数据框提取的列,并使用单个方括号。这样做的目的是将该列与另一个数据框合并。示例考虑以下数据框 - set.seed(9) x1