211 次查看
要按升序排列大量 csv 文件,我们可以使用 gtools 包中的 mixedsort 函数。例如,如果我们有一个随机排列在名为 FILES 的向量中的 csv 文件列表,则可以使用命令 mixedsort(sort(FILES)) 按升序排列这些文件示例实时演示文件 1
244 次查看
使用列号可以轻松地对 data.table 对象的一列进行排序,但使用列名进行排序则有所不同。如果列名存储在向量中,并且我们想使用此名称按升序排列 data.table 对象的一列,则将使用 order 函数以及单方括号和双方括号,如下面的示例所示。加载 data.table 包并创建一个 data.table 对象 - 示例库(data.table)x1
5K+ 次查看
shapiro 检验用于检验变量的正态性,该检验的零假设是变量服从正态分布。如果我们在 R 数据框中具有数值列,那么我们可能需要检查所有变量的正态性。这可以通过 apply 函数和 shapiro.test 来实现,如下面的示例所示。示例实时演示考虑以下数据框 - set.seed(321) x1
有时我们想提取表值,尤其是在我们有一个大表的情况下。这有助于我们了解表中特定项目的频率。要访问表值,我们可以使用单方括号。例如,如果我们有一个名为 TABLE 的表,则可以使用 TABLE[1] 访问表的第一个元素。示例 1 实时演示 x1
4K+ 次查看
箱线图的重要部分是 Y 轴,因为它有助于理解数据中的变异性,因此,如果我们知道数据描述,我们可以删除 X 轴标签。要使用 ggplot2 为单个变量创建没有 X 轴标签的箱线图,我们可以使用 theme 函数并将 X 轴标签设置为空白,如下面的示例所示。示例实时演示考虑以下数据框 - y
112 次查看
可以使用 sample 函数创建随机样本,此随机样本为每个单元提供相同的被选中概率,因此称为简单随机样本。如果我们想要一个每个单元具有不同被选中概率的样本,则需要使用参数 prob,如下面的示例所示。示例 1 实时演示 x1
6K+ 次查看
要删除字符串末尾的点和数字,我们可以使用 gsub 函数。它将在向量中搜索字符串末尾的点和数字模式,然后可以通过使用不带空格的双引号来删除该模式。之后将传递向量,如下面的示例所示。示例 1 实时演示 x1
311 次查看
要创建相关矩阵图,我们可以使用 GGally 包的 ggpairs 函数。例如,如果我们有一个包含五列的数据框 df,则可以创建相关矩阵图作为 ggpairs(df)。使用 ggpairs 的相关矩阵图显示相关值以及散点图和对角线上变量的分布。示例实时演示考虑以下数据框 - set.seed(212) x
要将列表元素转换为单个字符串,我们可以使用 paste 函数,但首先我们需要取消列表元素。此外,由于我们想要创建一个单个字符串,因此输出的末尾需要双引号。例如,如果我们有一个包含 5 个元素(例如 1、2、3、4、5)的列表,则将这些元素转换为单个字符串将是“12345”。示例 1 实时演示列表 1
上述错误意味着尚未创建绘图,因此无法使用 abline 函数在绘图上绘制任何内容。因此,需要先创建一个绘图才能使用 abline 函数创建线条或其他任何内容。大多数情况下,abline 用于在绘图上创建回归线,因此我们需要先创建散点图,然后再使用 abline。示例实时演示考虑以下数据框 - x