通常,我们在因子列中具有重复值,这意味着因子列具有许多级别,并且每个级别都会出现很多次。在这种情况下,如果我们有一个频率列,那么我们希望根据因子列的值找到该频率的总和,这可以通过使用 aggregate 函数来完成。示例 实时演示考虑以下数据框 -> set.seed(109) > Class Frequency df1 df1输出 Class Frequency 1 E 9 2 D 5 3 B 10 ... 阅读更多
R 数据框可以有非常多的列,我们可能希望选择除少数列之外的所有列。在这种情况下,最好通过取消选择不需要的列来提取列,而不是选择需要的列,因为需要的列数多于不需要的列数。这可以通过使用 ! 符号和单方括号轻松完成。示例考虑以下数据框 - 实时演示> Age Gender Salary ID Education Experience df df输出 ID Gender Age Salary Experience Education 1 ... 阅读更多
数据框可以有多种类型的列,其中一些可以根据其特征组合成单个列。例如,如果一列包含字符,而另一列包含数字,那么我们可能希望通过使用特殊字符分隔它们来连接它们,以将其显示为标识。示例考虑以下数据框 - 实时演示> ID Frequency set.seed(111) > ID Frequency df df输出 ID Frequency 1 A 78 2 B 84 3 C 83 4 D 47 5 E 25 6 F 59 7 G 69 ... 阅读更多