2K+ 阅读量
有时我们希望从一个较长的字符串中提取一个子字符串,并且该子字符串位于特定字符之后。例如,一个字符串可能是“Learning.Computer.Science.is.not.difficult-Author”,我们希望从中提取单词 Author。这可以通过 gsub 函数来实现。示例x1
我们知道一个因子变量有很多水平,但可能我们现有的因子水平不是我们需要的形式。例如,如果我们想要大写字母作为因子水平,但原始数据是小写英文字母。在这种情况下,我们可以使用 dplyr 包中的 mutate 函数重命名这些因子水平。示例考虑以下数据框 -城市
925 阅读量
我们知道一个因子变量有很多水平,但可能我们现有的因子水平不是我们需要的形式。例如,如果我们想要大写字母作为因子水平,但原始数据是小写英文字母。在这种情况下,我们可以使用 dplyr 包中的 mutate 函数转换这些因子水平。示例考虑以下数据框 -x
通常,当我们向 R 数据框中添加一列时,该列会添加到列的末尾,但我们可能需要将其添加到前面。这完全取决于我们的使用习惯、对变量的熟悉程度以及它们的需要。我们可以使用 cbind 函数在 R 数据框的前面添加一列。示例考虑以下数据框 -ID
3K+ 阅读量
矩阵只包含数值,有时这些值可能是输入错误的,或者我们可能希望根据某些条件替换矩阵中的某些值。例如,如果矩阵中有一些 5,那么我们可能希望将所有 5 替换为大于 5 或小于 5 的另一个数字。示例考虑以下矩阵 -set.seed(123) M
282 阅读量
通常,我们从 R 数据框中提取列作为向量,但有时我们可能需要将一列作为数据框,因此,我们可以使用 as.data.frame 提取我们想要作为数据框提取的列,并使用单个方括号。这样做的目的是将该列与另一个数据框合并。示例考虑以下数据框 -set.seed(9) x1
当我们使用 par(mfrow) 时,我们定义了要在绘图窗口中绘制的绘图数量,当我们绘制所有必要的绘图后,它会从第一个绘图重新开始。例如,如果我们将 par(mfrow) 设置为 (2,2),那么我们将在绘图窗口中得到四个绘图,但如果我们想在绘图窗口中创建一个绘图,那么它将不起作用,它将在左上角显示一个小的绘图。为了解决这个问题,我们可以将 par(mfrow) 设置为 (1,1)。示例par(mfrow=c(2,2)) x
466 阅读量
矩阵只包含数值,因此,如果我们转换一个包含字符串类型因子变量的数据框,那么因子水平将转换为数字。这些数字是基于因子水平的第一个字符,例如,如果字符串以 A 开头,则它将得到 1,依此类推。如果数据框包含字符串类型的因子变量,要将其转换为矩阵,我们需要将数据框读取为矩阵。示例考虑以下数据框 -x1
373 阅读量
当我们创建散点图或任何其他绘图,并且原始数据中的值以科学计数法表示时,绘图的轴值也以科学计数法绘制。这使得绘图变得模糊,因此读取或解释绘图变得困难。因此,我们需要将轴标签的科学计数法转换为普通数字,这可以通过使用 scale_x_continuous(labels =comma) 和 scale_y_continuous(labels=comma) 对两个轴进行操作。示例考虑以下数据框 -set.seed(101) x
条形图是用于分类数据的最常用绘图之一,它可以通过 R 中的 ggplot2 轻松实现。当我们使用 ggplot2 创建条形图时,条形与 X 轴之间以及最大条形与绘图顶部区域之间存在一些空间。这可以通过使用 scale_y_continuous 函数来减少或增加。示例考虑以下数据框 -x