844 次浏览
当我们使用 dplyr 包的 group_by 函数时,我们需要传递本质上是分类的列名。如果我们想使用相同列的索引,则需要使用 group_by_at 函数,其中我们可以将列索引作为参数传递。示例 1 实时演示考虑以下数据框 -x1 1 A 2 2 B 6 3 C 5 4 D 7示例 2 实时演示y1
10K+ 次浏览
要查找矩阵中行、列和总和,只需分别使用函数 rowSums、colSums 和 sum 即可。行和、列和以及总和大多用作比较分析工具,例如方差分析、卡方检验等。示例 1 实时演示M1
913 次浏览
如果 R 向量中存在缺失值,则它会被计为向量中的唯一值,因此无法直接提取唯一值。为此,我们需要将 unique 与 na.omit 函数一起使用。例如,如果我们有一个名为 x 的向量,其中包含缺失值,则可以按 length(unique(na.omit(x))) 的方式提取唯一值。示例 1 实时演示x1
4K+ 次浏览
要将列表中的所有值乘以一个数字,我们可以使用 lapply 函数。在 lapply 函数内部,我们需要提供乘法符号 *,以及列表名称和我们要乘以所有列表值的数字。例如,如果我们有一个名为 LIST 的列表,并且我们想将 LIST 中的每个值乘以 2,则可以使用命令 lapply(LIST,"*",2) 来完成。示例 1 实时演示List1
115 次浏览
要创建一列,其中包含行中字符串值的大小最大,我们可以使用 apply 函数,并通过创建如下例所示的函数来定义最大值的大小。如果所有列的字符数相同或存在一些相同的值,则输出将是第一个值。示例 1 实时演示考虑以下数据框 -x1
1K+ 次浏览
当我们在 R 中使用 table 函数时,输出显示向量或数据框列中存在的值得频率。如果我们想创建包含不存在值的频率为零的表,则首先需要先将其转换为因子,然后使用 table 函数。示例 1 实时演示x1
3K+ 次浏览
要查找每个变量与其余变量的相关性,我们可以创建一个相关矩阵,但对于仅一个变量与所有其他变量的相关性,我们需要在 cor 函数中定义列。输出将表示传递到函数中的列和行。示例 1 实时演示考虑以下数据框 -x1
平方偏差的总和是每个值与平均值之间差值的平方之和。要查找此值,我们需要在 R 平台中创建公式。例如,如果我们有一个名为 df 的数据框,其中包含一列 x,则可以使用 sum((df$x−mean(df$x))^2) 计算 x 的平方偏差的总和。示例 1 实时演示考虑以下数据框 -set.seed(1021) x1
935 次浏览
我们可能希望将分类列转换为数值型,原因例如序数或名义数据的参数结果。如果我们有分类列,并且值是使用字母/单词表示的,则转换将基于类别的第一个字符。要了解转换,请查看以下示例。示例 1 实时演示考虑以下数据框 -set.seed(100) x1
784 次浏览
列表中变量的名称实际上是列表元素。这些元素可以命名也可以未命名。命名可以通过 names 函数完成,重命名也可以通过相同的方式完成。例如,如果我们有一个名为 LIST 的列表,则可以使用以下命令来获取 LIST 中元素的名称:names(LIST)