903 次浏览
我们可以使用 `cbind` 按列连接向量,无论这些向量长度是否相同。如果向量长度相同,则两个向量的所有值都会打印出来;如果向量长度不同,则较短向量的值会重复。但是,我们可能不希望重复较短向量的值/元素,这可以通过将较短向量的长度设置为较长向量的长度来实现,这会在较短向量中创建 NA 值…… 阅读更多
780 次浏览
通常,我们按列合并数据框,因为列名在数据集中被认为是突出的,但是也可以使用行合并两个数据框。与按列合并相比,按行合并更有可能导致更多未清理的数据。这可以使用 `merge` 函数及其 `by` 参数来完成。示例考虑以下数据框 - df1
407 次浏览
我们经常在 R 中创建数据的子集,以便根据数据分析项目中整体目标的较小目标执行计算。有时,此子集设置以字符串而不是数值为条件。我们还可以使用 `grep` 函数基于列中行值的子字符串创建 data.table 的子集。示例考虑以下 data.table 对象 - x1
1K+ 次浏览
我们可以使用 `par(mfrow)` 在 R 中的单个绘图窗口中创建多个绘图。这些绘图可能完全不同,也可能相同。无论绘图类型如何,我们都可以为所有绘图提供一个公共标题。这可能是一种情况,例如,我们想显示一些变量的散点图和直方图,但我们的分析目标是固定的。要在绘图窗口中的绘图之间写入公共标题,我们可以使用 `mtext` 并通过更改 `line` 参数来调整标题位置。示例 `set.seed(100) x1`
2K+ 次浏览
有时我们想从一个大字符串中提取一个子字符串,而该子字符串位于特定字符之后。例如,一个字符串可能是“Learning.Computer.Science.is.not.difficult-Author”,我们想从中提取单词“Author”。这可以使用 `gsub` 函数来完成。示例 `x1`
我们知道因子变量有很多水平,但我们现有的因子水平可能不是我们需要的形式。例如,如果我们想要大写字母作为因子水平,但原始数据包含小写英文字母。在这种情况下,我们可以使用 dplyr 包的 `mutate` 函数重命名这些因子水平。示例考虑以下数据框 - City
925 次浏览
我们知道因子变量有很多水平,但我们现有的因子水平可能不是我们需要的形式。例如,如果我们想要大写字母作为因子水平,但原始数据包含小写英文字母。在这种情况下,我们可以使用 dplyr 包的 `mutate` 函数转换这些因子水平。示例考虑以下数据框 - x
通常,当我们将新列添加到现有 R 数据框时,该列会添加到列的末尾,但我们可能需要将其放在前面。这完全取决于我们的易用性、对变量的熟悉程度及其需求。我们可以使用 `cbind` 函数在现有 R 数据框的前面添加新列。示例考虑以下数据框 - ID
3K+ 次浏览
矩阵只有数值,有时这些值输入错误,或者我们可能想根据某些条件替换矩阵中的一些值。例如,如果矩阵中有一些 5,我们可能想将所有 5 替换为大于 5 或小于 5 的另一个数字。示例考虑以下矩阵 - `set.seed(123) M`
282 次浏览
通常,我们从 R 数据框中将列提取为向量,但有时我们可能需要一个列作为数据框,因此,我们可以使用 `as.data.frame` 来提取我们想用单方括号作为数据框提取的列。这背后的目的可能是将该列与另一个数据框合并。示例考虑以下数据框 - `set.seed(9) x1`