R 数据框可能包含大量行,如果某些行对数据分析无用,我们可能希望将其删除。因此,我们可以在开始分析过程之前删除这些行。可以说,删除某些行是数据清理的一部分,显然数据清理有助于我们为分析创建一个平滑的数据集。在 R 中,我们可以简单地使用 head 函数从 R 数据框中删除最后几行,我们也可以将其存储为新的数据…… 阅读更多
我们使用 head 函数查看 R 数据框中的一些前几个值,但它显示了整个数据框的前几个值,而没有考虑因子列的组。因此,如果我们在特定组中有很多值,那么单独使用 head 函数似乎并没有什么帮助,我们必须使用某些东西来提取每组的前几个值。这可以通过使用带单方括号的 by 函数和 head 函数来完成。示例data(iris) str(iris) 'data.frame': 150 obs. of 5 variables: $ Sepal.Length: num 5.1 4.9 4.7 ... 阅读更多
通常,我们需要对数据框进行子集化,有时这种子集化是基于字符串的。如果我们有一个字符列或一个因子列,那么我们可能有它的值作为字符串,我们可以通过删除包含值或部分值的行来对整个数据框进行子集化,例如,我们可以删除在 Species 列中包含 set 或 setosa 单词的所有行。示例考虑以下数据框 - 字符