2K+ 次浏览
有时我们会得到组或因子的均值和标准差,这些通常来自先前的研究,称为二手数据。在这种情况下,可以使用 ggplot2 包的 geom_error 函数定义最小值和最大值来创建带有均值和标准差的折线图,其中,如果最小值设置为均值减去一个标准差,最大值设置为均值加上一个标准差,则均值和标准差之间的差值定义标准差。示例考虑以下数据框 - 实时演示组
255 次浏览
如果我们有一个字符列,这意味着该列更有可能包含重复值,因此无法直接根据字符列中的值查找数值列的均值。为此,我们可以使用 aggregate 函数,如下例所示。示例 1考虑以下数据框 - 实时演示set.seed(214) x1
1K+ 次浏览
根据我们的目标,可能需要将矩阵行转换为列表,这意味着每一行都将成为列表的一个元素。这可以通过使用 as.list 函数来完成,但首先我们需要将矩阵转置后转换为数据框。例如,如果我们有一个名为 M 的矩阵,则其行将使用下面编写的命令转换为列表 - as.list(data.frame(t(M)))示例 1 实时演示M1
3K+ 次浏览
要为连续向量创建箱体,我们可以使用 cut 函数并将箱体存储在包含原始向量的数据框中。cut 函数中的值必须根据向量值的范围传递,否则箱体值中将出现 NA。例如,如果我们有一个包含 0.55 的向量,并且我们没有在 cut 函数中使用 0,则第一个箱体将为 NA。查看以下示例以了解如何正确执行此操作。示例 1 实时演示x1
有时数值会被记录为字符值,在开始分析之前我们需要将其转换为数值类型。这在 R 中对于整个数据框也是可能的。因此,我们可以使用 sapply 函数将数据框的列转换为数值类型,并通过使用 as.data.frame 读取输出并将其保存在数据框中。示例 1考虑以下数据框 - 实时演示x
738 次浏览
基础 R 中的箱线图包含一个框,该框称为边框。我们可以使用 frame 参数在创建箱线图时去除该边框。例如,如果我们有一个名为 x 的向量,并且我们想要创建无边框的箱线图,则可以使用命令 boxplot(x,frame=F) 来完成。这将删除箱线图的所有边,除了 Y 轴标签,因为这将帮助我们了解变量的分布。示例 实时演示x
291 次浏览
如果向量中存在缺失值,则此类向量的图将不会显示所有值,只会显示非缺失值。如果我们想要通过在图中添加缺失值来创建图,则需要使用 cbind 为向量的长度定义 X 轴,并使用实际向量定义 Y 轴,但缺失值将被忽略,如下例所示。示例 实时演示x
961 次浏览
每当我们打印任何向量时,R 窗口的左侧都会显示索引,即使向量中只有一个值,索引也会存在。例如,如果我们打印一个值为 2 的向量,则打印输出将为 [1] 2,其中 [1] 表示索引。如果我们想要打印不带索引的向量,则可以使用 cat 函数,如下例所示。示例 1 实时演示x1
指数数也称为科学计数法,这些数以字母 e 表示指数。例如,数字 12340000 可以表示为 1.234e + 107。我们可以将其四舍五入到 1.2e + 107,在 R 中可以使用 singif 函数来完成。示例 1 实时演示x1
838 次浏览
我们知道有些年份是闰年,有些年份是平年。闰年有 366 天,平年有 365 天。要创建包含特定年份所有日期的向量,我们可以使用该年的第一天和最后一天,通过使用 as.Date 读取它们并使用 seq 函数创建序列。查看以下示例以了解它是如何完成的。示例 1创建包含 2020 年日期的向量 - 实时演示seq(as.Date("2020-01-01"), as.Date("2020-12-31"), by="1 day")输出[1] "2020−01−01" "2020−01−02" "2020−01−03" "2020−01−04" "2020−01−05" [6] "2020−01−06" "2020−01−07" "2020−01−08" "2020−01−09" "2020−01−10" [11] "2020−01−11" "2020−01−12" "2020−01−13" "2020−01−14" ... 阅读更多